欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

golang 八进制 utf-8 编码转中文

程序员文章站 2024-03-18 18:50:52
...

当调试程序,打印出变量的值时,有可能输出的是八进制 utf-8 编码(尤其是 protobuf 变量)
例如:\346\200\241\346\200\241\346\200
这样的字符串如果作为字面量,go可以自动转化,
但如果是从文件或string中读取,就不行了。
可以使用正则表达式简单处理下
如下代码示例:

package main

import (
    "fmt"
    "regexp"
    "strconv"
)

// 转换8进制utf-8字符串到中文
// eg: `\346\200\241` -> 怡
func convertOctonaryUtf8(in string) string {
    s := []byte(in)
    reg := regexp.MustCompile(`\\[0-7]{3}`)

    out := reg.ReplaceAllFunc(s,
        func(b []byte) []byte {
            i, _ := strconv.ParseInt(string(b[1:]), 8, 0)
            return []byte{byte(i)}
        })
    return string(out)
}

func main() {
    s1 := "\346\200\241" // 字面量
    s2 := `\346\200\241` // 原始字符串

    fmt.Println("s1 =", s1)
    fmt.Println("s2 =", s2)

    // 转化 s2
    s3 := convertOctonaryUtf8(s2)
    fmt.Println("s3 =", s3)
}

运行结果:
golang 八进制 utf-8 编码转中文