当前位置: 首页 > news >正文

golang--字符串处理(runeleixing )

在 Go 语言中,rune 类型是一个非常重要的基础类型,用于处理 Unicode 字符。以下是关于 rune 类型的详细用法说明:


一、基础概念

  1. 类型定义
    runeint32 的别名(type rune = int32),表示一个 Unicode 码点(Code Point)。

    var r rune = 'A'      // 等价于 int32(65)
    var emoji rune = '😊'  // Unicode 码点 U+1F60A
    
  2. byte 的区别

    • byteuint8 的别名,只能表示 ASCII 字符
    • rune 可表示所有 Unicode 字符(包括中文、emoji 等多字节字符)

二、核心用法

1. 字符串遍历

正确处理多字节字符:

s := "Hello, 世界!"

// 错误方式:按字节遍历(会乱码)
for i := 0; i < len(s); i++ {
    fmt.Printf("%c", s[i]) // 输出:Hello, 世界!
}

// 正确方式:按 rune 遍历
for _, r := range s {
    fmt.Printf("%c", r) // 输出:Hello, 世界!
}
2. 字符串与 []rune 转换
str := "Go语言"
runes := []rune(str)  // 转换为 rune 切片
fmt.Println(runes)     // [71 111 35821 35328]

// 转换回字符串
newStr := string(runes)
fmt.Println(newStr)    // "Go语言"
3. 字符统计

获取实际的字符数量(而非字节数):

s := "🐶狗dog"
fmt.Println(len(s))          // 输出 9(字节数)
fmt.Println(len([]rune(s)))  // 输出 4(字符数)

三、常见应用场景

1. 字符串操作

字符串反转(正确处理 Unicode):

func ReverseString(s string) string {
    runes := []rune(s)
    for i, j := 0, len(runes)-1; i < j; i, j = i+1, j-1 {
        runes[i], runes[j] = runes[j], runes[i]
    }
    return string(runes)
}

fmt.Println(ReverseString("Hello, 世界!")) // "!界世 ,olleH"

安全截取子串:

func SafeSubstr(s string, start, length int) string {
    runes := []rune(s)
    if start >= len(runes) {
        return ""
    }
    end := start + length
    if end > len(runes) {
        end = len(runes)
    }
    return string(runes[start:end])
}

fmt.Println(SafeSubstr("Go语言很棒", 2, 2)) // "语言"
2. 字符验证

检查字符串是否只包含字母:

func IsAlpha(s string) bool {
    for _, r := range s {
        if !unicode.IsLetter(r) {
            return false
        }
    }
    return true
}

fmt.Println(IsAlpha("Hello世界"))  // false
fmt.Println(IsAlpha("HelloWorld")) // true

四、注意事项

  1. 内存占用
    每个 rune 占 4 字节,处理纯 ASCII 文本时效率低于 byte

  2. 性能优化
    避免在循环中频繁转换 string[]rune

    // 错误方式(每次循环都转换)
    for i := 0; i < len(s); i++ {
        runes := []rune(s)
        // ...
    }
    
    // 正确方式(预先转换)
    runes := []rune(s)
    for i := 0; i < len(runes); i++ {
        // ...
    }
    
  3. 特殊字符处理
    使用 unicode 包处理复杂字符:

    r := 'ñ'
    fmt.Println(unicode.IsLetter(r))  // true
    fmt.Println(unicode.IsUpper(r))   // false
    fmt.Println(unicode.ToUpper(r))   // 'Ñ'
    

五、进阶用法

1. 自定义字符处理
// 移除字符串中所有非数字字符
func KeepNumbers(s string) string {
    var result []rune
    for _, r := range s {
        if unicode.IsNumber(r) {
            result = append(result, r)
        }
    }
    return string(result)
}

fmt.Println(KeepNumbers("Tel: (123)456-789")) // "123456789"
2. 组合字符处理
import "golang.org/x/text/unicode/norm"

func NormalizeString(s string) string {
    return norm.NFC.String(s)  // 将字符规范化为组合形式
}

s := "caf\u00e9"        // "café"
fmt.Println(NormalizeString(s))

总结表格

场景推荐类型说明
处理 ASCII 文本byte内存效率更高
处理多语言文本rune支持所有 Unicode 字符
字符串遍历rune自动处理多字节字符
字符级操作rune安全进行反转、截取等操作
低内存环境byte减少内存占用(需确保纯 ASCII)

掌握 rune 的用法可以避免 Go 语言中常见的字符串处理错误,特别是在处理国际化场景时非常关键。

相关文章:

  • Idea24.3 如何设置Git忽略某一个文件
  • Luckfox Pico Max运行RKNN-Toolkit2中的Yolov5 adb USB仿真
  • Winform(C#) 项目保存页面
  • 写一个python组件
  • 基于Springboot的网上服装商城系统【附源码】
  • ok113i——交叉编译音视频动态库
  • 【架构】微内核架构(Microkernel Architecture)
  • RHCE9.0版本笔记2:Linux基础与红帽企业Linux生态系统
  • 新手小白如何挖掘cnvd通用漏洞之存储xss漏洞(利用xss钓鱼)
  • 【实用工具】在 Windows 上使用 JVMS 管理多版本 JDK
  • wend看源码-(RAG工程)tiny-GraphRAG
  • MySQL | 库操作
  • 总结单例模式的写法(在线程安全的情况下)
  • 深入解析 MySQL 8 C++ 源码:二级索引回表操作
  • Redis7——基础篇(二)
  • QT异步编程之QMetaObject::invokeMethod
  • Windows桌面系统管理8:项目实施
  • 青少年编程都有哪些比赛可以参加
  • 网络安全大数据架构 网络安全之数据安全
  • RMSNorm算子的CUDA实现
  • 国常会:研究深化国家级经济技术开发区改革创新有关举措等
  • 央行设立服务消费与养老再贷款,额度5000亿元
  • 青年与人工智能共未来,上海创新创业青年50人论坛徐汇分论坛举办
  • 乌克兰议会批准美乌矿产协议
  • 中美“第二阶段”贸易协定是否会在会谈中提出?商务部回应
  • 大风暴雨致湖南岳阳县6户房屋倒塌、100多户受损