utf-8编码:自动将英文保存为1个字符,中文3个字符。ASCll编码被囊括在内。python
unicode:将全部字符保存为2给字符,容纳了世界上全部的编码。函数
replace()函数:替换字符串内字符学习
str1='a1234'编码
str2=str1.replace('a','A') #将字符a替换为A操作系统
须要注意的是,在函数replace()的做用下,虽然修改了str1的内容,可是变量str1不变,其修改存储在str2中。翻译
ord()函数:获取字符的utf-8编码的整数形式。code
ord('A') #输出65orm
ord('中') #输出20013utf-8
chr()函数:将utf-8的整数形式转换为对应字符。unicode
chr('67') #输出'C'
chr('25991') #输出'文'
encode()函数:获取字符对应编码方式的16进制形式。
'我'.encode('utf-8') #输出b'\xe6\x88\x91'
其中b表示以字节的方式存储,在utf-8编码中,中文有3个字节,转化为三个16进制数。
decode()函数:解码函数,将上述获得的数字按照对应的编码形式翻译为对应字符
b'\xe6\x88\x91'.decode('utf-8',errors='ignore') #输出'我'
其中errors='ignore'表示忽视错误字节,如输入四个字节时,默认读取前三个。
len()函数:用于计算字符串的长度或字节数
为了确保解释器以utf-8编码读取文件,须要在文件开头写上两行注释
# !/usr/bin/env python3
# -*- coding: utf-8 -*-
第一行用于告诉Linux操做系统,这是Python文件,第二行说明文字编码方式。
与C语言相同,用“%”获取,格式以下
'Today is %s , i have $' % ('good','10000')
格式 | 内容 |
---|---|
%d | 整数 |
%f | 浮点数 |
%s | 字符串 |
%x | 16进制数 |
%% | % |
format()函数:用于传入参数
'Hello, {0}! You have ${1}'.format('li',100000)