字符串或串(String)是由数字、字母、下划线组成的一串字符。安全
Lua 语言中字符串可使用如下三种方式来表示:网络
单引号间的一串字符。函数
双引号间的一串字符。lua
[[和]]间的一串字符。3d
以上三种方式的字符串实例以下:code
string1 = "Lua"orm
print("\"字符串 1 是\"",string1)教程
string2 = 'codercto.com'索引
print("字符串 2 是",string2)字符串
string3 = [["Lua 教程"]]
print("字符串 3 是",string3)
以上代码执行输出结果为:
"字符串 1 是" Lua
字符串 2 是 codercto.com
字符串 3 是 "Lua 教程"
转义字符用于表示不能直接显示的字符,好比后退键,回车键,等。如在字符串转换双引号可使用 "\""。
全部的转义字符和所对应的意义:
转义字符意义ASCII码值(十进制)
\a响铃(BEL)007
\b退格(BS) ,将当前位置移到前一列008
\f换页(FF),将当前位置移到下页开头012
\n换行(LF) ,将当前位置移到下一行开头010
\r回车(CR) ,将当前位置移到本行开头013
\t水平制表(HT) (跳到下一个TAB位置)009
\v垂直制表(VT)011
\\表明一个反斜线字符''\'092
\'表明一个单引号(撇号)字符039
\"表明一个双引号字符034
\0空字符(NULL)000
\ddd1到3位八进制数所表明的任意字符三位八进制
\xhh1到2位十六进制所表明的任意字符二位十六进制
字符串操做
Lua 提供了不少的方法来支持字符串的操做:
序号方法 & 用途
1string.upper(argument):
字符串所有转为大写字母。
2string.lower(argument):
字符串所有转为小写字母。
3string.gsub(mainString,findString,replaceString,num)
在字符串中替换,mainString为要替换的字符串, findString 为被替换的字符,replaceString 要替换的字符,num 替换次数(能够忽略,则所有替换),如:
> string.gsub("aaaa","a","z",3);
zzza 3
4string.find (str, substr, [init, [end]])
在一个指定的目标字符串中搜索指定的内容(第三个参数为索引),返回其具体位置。不存在则返回 nil。
> string.find("Hello Lua user", "Lua", 1)
7 9
5string.reverse(arg)
字符串反转
> string.reverse("Lua")
auL
6string.format(...)
返回一个相似printf的格式化字符串
> string.format("the value is:%d",4)
the value is:4
7string.char(arg) 和 string.byte(arg[,int])
char 将整型数字转成字符并链接, byte 转换字符为整数值(能够指定某个字符,默认第一个字符)。
> string.char(97,98,99,100)
abcd
> string.byte("ABCD",4)
68
> string.byte("ABCD")
65
>
8string.len(arg)
计算字符串长度。
string.len("abc")
3
9string.rep(string, n)
返回字符串string的n个拷贝
> string.rep("abcd",2)
abcdabcd
10..
连接两个字符串
> print("www.codercto".."com")
www.coderctocom
11string.gmatch(str, pattern)
回一个迭代器函数,每一次调用这个函数,返回一个在字符串 str 找到的下一个符合 pattern 描述的子串。若是参数 pattern 描述的字符串没有找到,迭代函数返回nil。
> for word in string.gmatch("Hello Lua user", "%a+") do print(word) end
Hello
Lua
user
12string.match(str, pattern, init)
string.match()只寻找源字串str中的第一个配对. 参数init可选, 指定搜寻过程的起点, 默认为1。
在成功配对时, 函数将返回配对表达式中的全部捕获结果; 若是没有设置捕获标记, 则返回整个配对字符串. 当没有成功的配对时, 返回nil。
> = string.match("I have 2 questions for you.", "%d+ %a+")
2 questions
> = string.format("%d, %q", string.match("I have 2 questions for you.", "(%d+) (%a+)"))
2, "questions"
字符串大小写转换
如下实例演示了如何对字符串大小写进行转换:
string1 = "Lua";
print(string.upper(string1))
print(string.lower(string1))
以上代码执行结果为:
LUA
lua
字符串查找与反转
如下实例演示了如何对字符串进行查找与反转操做:
string = "Lua Tutorial"
-- 查找字符串
print(string.find(string,"Tutorial"))
reversedString = string.reverse(string)
print("新字符串为",reversedString)
以上代码执行结果为:
5 12
新字符串为 lairotuT auL
字符串格式化
Lua 提供了 string.format() 函数来生成具备特定格式的字符串, 函数的第一个参数是格式 , 以后是对应格式中每一个代号的各类数据。
因为格式字符串的存在, 使得产生的长字符串可读性大大提升了。这个函数的格式很像 C 语言中的 printf()。
如下实例演示了如何对字符串进行格式化操做:
格式字符串可能包含如下的转义码:
%c - 接受一个数字, 并将其转化为ASCII码表中对应的字符
%d, %i - 接受一个数字并将其转化为有符号的整数格式
%o - 接受一个数字并将其转化为八进制数格式
%u - 接受一个数字并将其转化为无符号整数格式
%x - 接受一个数字并将其转化为十六进制数格式, 使用小写字母
%X - 接受一个数字并将其转化为十六进制数格式, 使用大写字母
%e - 接受一个数字并将其转化为科学记数法格式, 使用小写字母e
%E - 接受一个数字并将其转化为科学记数法格式, 使用大写字母E
%f - 接受一个数字并将其转化为浮点数格式
%g(%G) - 接受一个数字并将其转化为%e(%E, 对应%G)及%f中较短的一种格式
%q - 接受一个字符串并将其转化为可安全被Lua编译器读入的格式
%s - 接受一个字符串并按照给定的参数格式化该字符串
为进一步细化格式, 能够在%号后添加参数. 参数将以以下的顺序读入:
(1) 符号: 一个+号表示其后的数字转义符将让正数显示正号. 默认状况下只有负数显示符号.
(2) 占位符: 一个0, 在后面指定了字串宽度时占位用. 不填时的默认占位符是空格.
(3) 对齐标识: 在指定了字串宽度时, 默认为右对齐, 增长-号能够改成左对齐.
(4) 宽度数值
(5) 小数位数/字串裁切: 在宽度数值后增长的小数部分n, 若后接f(浮点数转义符, 如%6.3f)则设定该浮点数的小数只保留n位, 若后接s(字符串转义符, 如%5.3s)则设定该字符串只显示前n位.
string1 = "Lua"
string2 = "Tutorial"
number1 = 10
number2 = 20
-- 基本字符串格式化
print(string.format("基本格式化 %s %s",string1,string2))
-- 日期格式化
date = 2; month = 1; year = 2014
print(string.format("日期格式化 %02d/%02d/%03d", date, month, year))
-- 十进制格式化
print(string.format("%.4f",1/3))
以上代码执行结果为:
基本格式化 Lua Tutorial
日期格式化 02/01/2014
0.3333
其余例子:
string.format("%c", 83) 输出S
string.format("%+d", 17.0) 输出+17
string.format("%05d", 17) 输出00017
string.format("%o", 17) 输出21
string.format("%u", 3.14) 输出3
string.format("%x", 13) 输出d
string.format("%X", 13) 输出D
string.format("%e", 1000) 输出1.000000e+03
string.format("%E", 1000) 输出1.000000E+03
string.format("%6.3f", 13) 输出13.000
string.format("%q", "One\nTwo") 输出"One\
Two"
string.format("%s", "monkey") 输出monkey
string.format("%10s", "monkey") 输出 monkey
string.format("%5.3s", "monkey") 输出 mon
字符与整数相互转换
如下实例演示了字符与整数相互转换:
-- 字符转换
-- 转换第一个字符
print(string.byte("Lua"))
-- 转换第三个字符
print(string.byte("Lua",3))
-- 转换末尾第一个字符
print(string.byte("Lua",-1))
-- 第二个字符
print(string.byte("Lua",2))
-- 转换末尾第二个字符
print(string.byte("Lua",-2))
-- 整数 ASCII 码转换为字符
print(string.char(97))
以上代码执行结果为:
76
97
97
117
117
a
其余经常使用函数
如下实例演示了其余字符串操做,如计算字符串长度,字符串链接,字符串复制等:
string1 = "www."
string2 = "codercto"
string3 = ".com"
-- 使用 .. 进行字符串链接
print("链接字符串",string1..string2..string3)
-- 字符串长度
print("字符串长度 ",string.len(string2))
-- 字符串复制 2 次
repeatedString = string.rep(string2,2)
print(repeatedString)
以上代码执行结果为:
链接字符串 www.codercto.com
字符串长度 6
coderctocodercto
匹配模式
Lua 中的匹配模式直接用常规的字符串来描述。 它用于模式匹配函数 string.find, string.gmatch, string.gsub, string.match。
你还能够在模式串中使用字符类。
字符类指能够匹配一个特定字符集合内任何字符的模式项。好比,字符类%d匹配任意数字。因此你可使用模式串 '%d%d/%d%d/%d%d%d%d' 搜索 dd/mm/yyyy 格式的日期:
s = "Deadline is 30/05/1999, firm"
date = "%d%d/%d%d/%d%d%d%d"
print(string.sub(s, string.find(s, date))) --> 30/05/1999
下面的表列出了Lua支持的全部字符类:
单个字符(除 ^$()%.[]*+-? 外): 与该字符自身配对
.(点): 与任何字符配对
%a: 与任何字母配对
%c: 与任何控制符配对(例如\n)
%d: 与任何数字配对
%l: 与任何小写字母配对
%p: 与任何标点(punctuation)配对
%s: 与空白字符配对
%u: 与任何大写字母配对
%w: 与任何字母/数字配对
%x: 与任何十六进制数配对
%z: 与任何表明0的字符配对
%x(此处x是非字母非数字字符): 与字符x配对. 主要用来处理表达式中有功能的字符(^$()%.[]*+-?)的配对问题, 例如%%与%配对
[数个字符类]: 与任何[]中包含的字符类配对. 例如[%w_]与任何字母/数字, 或下划线符号(_)配对
[^数个字符类]: 与任何不包含在[]中的字符类配对. 例如[^%s]与任何非空白字符配对
当上述的字符类用大写书写时, 表示与非此字符类的任何字符配对. 例如, %S表示与任何非空白字符配对.例如,'%A'非字母的字符:
> print(string.gsub("hello, up-down!", "%A", "."))
hello..up.down. 4
数字4不是字符串结果的一部分,他是gsub返回的第二个结果,表明发生替换的次数。
在模式匹配中有一些特殊字符,他们有特殊的意义,Lua中的特殊字符以下:
( ) . % + - * ? [ ^ $
'%' 用做特殊字符的转义字符,所以 '%.' 匹配点;'%%' 匹配字符 '%'。转义字符 '%'不只能够用来转义特殊字符,还能够用于全部的非字母的字符。
模式条目能够是:
单个字符类匹配该类别中任意单个字符;
单个字符类跟一个 '*', 将匹配零或多个该类的字符。 这个条目老是匹配尽量长的串;
单个字符类跟一个 '+', 将匹配一或更多个该类的字符。 这个条目老是匹配尽量长的串;
单个字符类跟一个 '-', 将匹配零或更多个该类的字符。 和 '*' 不一样, 这个条目老是匹配尽量短的串;
单个字符类跟一个 '?', 将匹配零或一个该类的字符。 只要有可能,它会匹配一个;
%n, 这里的 n 能够从 1 到 9; 这个条目匹配一个等于 n 号捕获物(后面有描述)的子串。
%bxy, 这里的 x 和 y 是两个明确的字符; 这个条目匹配以 x 开始 y 结束, 且其中 x 和 y 保持 平衡 的字符串。 意思是,若是从左到右读这个字符串,对每次读到一个 x 就 +1 ,读到一个 y 就 -1, 最终结束处的那个 y是第一个记数到 0 的 y。 举个例子,条目 %b() 能够匹配到括号平衡的表达式。
%f[set], 指 边境模式; 这个条目会匹配到一个位于 set 内某个字符以前的一个空串, 且这个位置的前一个字符不属于 set 。 集合 set 的含义如前面所述。 匹配出的那个空串之开始和结束点的计算就当作该处有个字符 '\0' 同样。
模式:
模式 指一个模式条目的序列。 在模式最前面加上符号 '^' 将锚定从字符串的开始处作匹配。 在模式最后面加上符号 '$' 将使匹配过程锚定到字符串的结尾。 若是 '^' 和 '$' 出如今其它位置,它们均没有特殊含义,只表示自身。
捕获:
模式能够在内部用小括号括起一个子模式; 这些子模式被称为 捕获物。 当匹配成功时,由 捕获物 匹配到的字符串中的子串被保存起来用于将来的用途。 捕获物以它们左括号的次序来编号。 例如,对于模式 "(a*(.)%w(%s*))" , 字符串中匹配到 "a*(.)%w(%s*)" 的部分保存在第一个捕获物中 (所以是编号 1 ); 由 "." 匹配到的字符是 2 号捕获物, 匹配到 "%s*" 的那部分是 3 号。
做为一个特例,空的捕获 () 将捕获到当前字符串的位置(它是一个数字)。 例如,若是将模式 "()aa()" 做用到字符串 "flaaap" 上,将产生两个捕获物: 3 和 5 。(编辑:雷林鹏 来源:网络 侵删)