走进Python世界(五)数据类型 2. 字符串(String)

字符串String

使用引号定义的一组能够包含数字,字母,符号(非特殊系统符号)的集合。python

如: 
app

Strval=“This is a test!”
Strval1='This is a test!'
Strval2="""This is a test"""

三重引号(DocString)

Python三重引号容许字符串跨越多行,包括逐字换行符,制表符和其余特殊字符。函数

三重引号语法由三个连续的单引号或双引号。this

#!/usr/bin/python

para_str = """this is a long string that is made up of
several lines and non-printable characters such as
TAB ( \t ) and they will show up that way when displayed.
NEWLINEs within the string, whether explicitly given like
this within the brackets [ \n ], or just a NEWLINE within
the variable assignment will also show up.
"""
print para_str;

当执行上面的代码中,产生如下结果。请注意如何每个特殊字符被转换到打印形式,一直到最后的换行符之间的字符串“up”结束闭三重引号。还要注意的是发生或者使用显式回车在一行或它的转义代码(\ n)的尾部的换行:spa

this is a long string that is made up of
several lines and non-printable characters such as
TAB (    ) and they will show up that way when displayed.
NEWLINEs within the string, whether explicitly given like
this within the brackets [
 ], or just a NEWLINE within
the variable assignment will also show up.



须要注意的是,python会认为 成对的引号之间的内容为字符串内容。code

以下面的例子 会有语法错误
索引

say=’let‘s go’

 File "<stdin>" , line1
 say=’let‘s go’
          ^
 SyntaxError:invalid syntax


正确的作法是ci

若是只包含单引号: 使用双引号来包含字符串字符串

若是包含单引号,双引号: 使用双引号来包含字符串,而且字符串内的双引号用转义字符 \ 来转义
string

say=“let‘s \" go”


转义字符

下表是未转义非打印字符的列表,能够用反斜线符号来表示。

转义字符被解释;在一个单引号和双引号字符串。

反斜线 

符号

十六进制

字符

描述
\a 0x07 铃声或警报
\b 0x08 退格键
\cx
Control-x
\C-x
Control-x
\e 0x1b 转义
\f 0x0c 换页
\M-\C-x
Meta-Control-x
\n 0x0a 新一行
\nnn
八进制表示法,其中n的范围为0.7
\r 0x0d 回车
\s 0x20 空格
\t 0x09 Tab键
\v 0x0b 垂直制表
\x
字符x
\xnn
十六进制表示法,其中n的范围是从0.9,a.f,或AF


字符串特殊操做符

操做符 描述 例子
a= Hello b=Python
+ 串联- 对操做符的两侧值增长

a + b 的值为 HelloPython

* 重复 - 建立新的字符串,连接相同的字符串的多个副本 a*2 的值为 -HelloHello
[] 切片- 从给定的索引字符指定 a[1] 的值为 e
[ : ]

范围切片 - 给定的范围内的字符

能够给定三个值,起始索引,结束索引,步长值

结束值的索引以前的会被取出来

省略起始索引,从0开始

省略结束索引,到末尾。

若是索引值为负数的话,则从末尾开始

步长值则表示,在切片范围取值的时候没间隔多少个字符串取出一个字符,默认值为1

若是步长值为负数也可表示 从右往左取

a[1:4] 的值为 ell

a[:4]的值为Hell

a[1:]的值为ello

a[-4:-1]的值为ello

a[::2]的值Hlo

in 成员 - 若是一个字符存在给定的字符串中,则返回true H in a 结果值为 1
not in 成员 - 若是输入的字符不给定的字符串中不存在,则返回true M not in a 结果值为 1
r/R 原始字符串- 禁止转义字符的实际意义。语法原始字符串是彻底同样的普通字符串,除了原始的字符串运算符,字母“r”,这以前的引号。在“r”能够小写(r)或大写字母(R)的,必须当即放置在第一引号前面。 print r'\n' 打印 \n 而且 print R'\n' 打印 \n


字符串格式化操做

Python最酷的功能是字符串格式运算符%。这种操做是惟一的字符串,弥补了C语言的printf()系列函数功能。下面是一个简单的例子:

#!/usr/bin/python

print "My name is %s and weight is %d kg!" % ('Zara', 21)

当执行上面的代码中,产生如下结果:

My name is Zara and weight is 21 kg!

下面是完整的,它能够与%符号使用列表:

格式符号 转换
%c 字符
%s 经过str() 字符串转换来格式化
%i 有符号十进制整数
%d 有符号十进制整数
%u 无符号十进制整数
%o 八进制整数
%x 十六进制整数(小写字母)
%X 十六进制整数(大写字母)
%e 索引符号(小写'e')
%E 索引符号(大写“E”)
%f 浮点实数
%g %f和%e 的简写
%G %f和%E的简写

其余支持的符号和功能以下表:

符号 功能
* 参数指定宽度和精度
- 左对齐
+ 显示符号
<sp> 一个正数前留一个空格
# 添加前导零('0')或十六进制前导0x“或”0X“,取决于”x“或”X“是否使用八进制。
0 从键盘左边添加零(而不是空格)
% '%%'给留下一个文字'%'
(var) 映射变量(字典参数)
m.n. m是最小的总宽度和n是数字,显示小数点后的位数(若是appl)

Unicode字符串

在Python普通字符串在内部存储为8位ASCII,而Unicode字符串被做为16位Unicode存储。这使得一组字符更加多样化,包括大多数语言在世界上的特殊字符。限制处理Unicode字符串

#!/usr/bin/python

print u'Hello, world!'

当执行上面的代码,产生如下结果:

Hello, world!

正如你所看到的,Unicode字符串使用前缀 u,就像原始字符串使用前缀 r

相关文章
相关标签/搜索