Go 字符串使用

时间 2019-11-08

标签字符串使用繁體版

原文原文链接

Go语言中的字符串

Go 中的字符串是兼容 Unicode 编码的，而且使用 UTF-8 进行编码，这样每个Unicode字符根据代码点的大小使用一、二、3或4个字节表示代码点。
Go 语言中的字符串是一个字节切片，也就是说单个字符能够被字节索引，咱们能够假定每一个字符的编码只会占用一个字节。例如：数组

var s = "Hello world!"
for i:= 0; i < len(s); i++ {
fmt.Printf("%x ", s[i])//48 65 6c 6c 6f 20 77 6f 72 6c 64 21 
}

若是是ASCII字符（用一个单一的UTF-8字节表示）（一个字节），这样作没有什么问题，如果非ASCII字符？。
对于每个Unicode字符呢，占用的字节大小不同，但是咱们怎么知道每次取多少个字节的大小？
因此在Go语言中，我可使用rune来解决这个问题，无论这个字符占多大的字节，均可以用一个rune来表示。
rune 是 Go 语言的内建类型，它也是 int32 的别称。在 Go 语言中，rune 表示一个代码点。编码

package main
import "fmt"
func main() {
   var  s =  "Hello world!"
   runes := []rune(s)
   for i:= 0; i < len(runes); i++ {
      fmt.Printf("%c ",runes[i])
   }//H e l l o   w o r l d ! 

}

注：https://naveenr.net/unicode-character-set-and-utf-8-utf-16-utf-32-encoding/ 来理解一下什么是 Unicode 和 UTF-8。spa

字符串的构造

用字节切片构造字符串
用 rune 切片构造字符串

用字节切片构造字符串.net

byteSlice 包含字符串 Café 用 UTF-8 编码后的 16 进制字节code

用字节切片构造字符串
package main
import (  
    "fmt"
)

func main() {  
    byteSlice := []byte{0x43, 0x61, 0x66, 0xC3, 0xA9}
    str := string(byteSlice)
    fmt.Println(str)//Café

用 rune 切片构造字符串blog

runeSlice 包含字符串 Señor的 16 进制的 Unicode 代码点索引

package main
import (  
    "fmt"
)

func main() {  
    runeSlice := []rune{0x0053, 0x0065, 0x00f1, 0x006f, 0x0072}
    str := string(runeSlice)
    fmt.Println(str)//Café

字符串切片处理

func main() {
	//字符串底层是一个byte数组，能够作切片处理
	str := "hello world!"
	//使用切片
	slice := str[2:]
	fmt.Println("slice=",slice)//slice= llo world!
}

字符串长度

获取字符串的字节数：len(str)方法返回包含在字符串文字中的字节数。token

package main
import "fmt"
func main() {
   var greeting =  "Hello world!"

   fmt.Printf("String Length is: ")
   fmt.Println(len(greeting))  //String Length is : 12

获取字符串的字符个数：utf8 package 包中的 func RuneCountInString(s string) (n int) 方法用来获取字符串的长度。这个方法传入一个字符串参数而后返回字符串中的 rune 的数量。utf-8

package main
import (
	"fmt"
	"unicode/utf8"
)
func length(s string) {
	fmt.Printf("length of %s is %d\n", s, utf8.RuneCountInString(s))}
func main() {
	word1 := "Señor"
	length(word1)//length of Señor is 5  
	word2 := "Pets"
	length(word2)//length of Señor is 4  
}

字符串的迭代

字符串的迭代有两种方法unicode

package main
import (
	"fmt"
)

//方法1，使用for range
func printChars1(s string) {
	for index, rune := range s {
		fmt.Printf("%c starts at byte %d\n", rune, index)
	}
}

//方法2
func printChars2(s string) {
	runes := []rune(s)
	for i:= 0; i < len(runes); i++ {
		fmt.Printf("%c ", runes[i])
	}
}

func main() {
	name := "Señor"
	printChars1(name)
	printChars2(name)
}

输出结果：

S starts at byte 0
e starts at byte 1
ñ starts at byte 2
o starts at byte 4
r starts at byte 5
S e ñ o r

字符串不可变

string 是不可变的，也就说不能经过 str[0] = 'w' 方式来修改字符串。

若是须要修改字符串，能够先将 string -> []byte 或者 []rune -> 修改 -> 重写转成 string

package main

import "fmt"

func main() {
	//字符串底层是一个byte数组，能够作切片处理
	str := "zello world!"
	arr1 := []byte(str)
	arr1[0] = 'h'
	str = string(arr1)
	fmt.Println("str=",str)

	//转换成byte后，能够处理英文和数字，不能处理中文
	//[]byte一个索引只能处理一个字节的数据，汉字超出范围，会出现乱码
	//前面咱们提到[]rune能将全部字符用一个字节表示
	arr2 := []rune(str)
	arr2[0] = '一'
	str = string(arr2)
	fmt.Println("str=",str)
}

结果：
str= hello world!
str= 一ello world!

链接字符串

strings包包含一个用于链接多个字符串的join()方法，其语法以下：

strings.Join(sample, " ")

Join链接数组的元素以建立单个字符串。第二个参数是分隔符，放置在数组的元素之间。

package main
import (
 "fmt"
 "strings"
)
func main() {
   greetings :=  []string{"Hello","world!"}   
   fmt.Println(strings.Join(greetings, " "))//Hello world!