如下笔记是我在 xue.cn 学习群之数据分析小组所整理分享的心得。相关背景是:我选择中文词频统计案例做为考察你们python基础功掌握程度。python
经过《Python读取文件内容为字符串的方法》,咱们已经拿到那个很长的字符了。如今咱们须要统计这个字符串中,有哪些字符,每一个字符分别出现了多少次。编程
这个方法至关简单,掌握《自学是门手艺》第一章就能写出来。零基础自学编程,代码写成这样能知足需求,但它逐个逐个计数,比较笨拙。编程语言
rlt = {}
for i in content:
if i in rlt.keys():
rlt[i] += 1
else:
rlt[i] = 1
复制代码
利用 python 内置函数 count() 来统计每一个字符出现的次数,同时经过if i not in rlt.keys():
确保每一个字符只用统计一次。方法2比1要效率一些。函数
rlt = {}
for i in content:
if i not in rlt.keys():
rlt[i] = content.count(i)
复制代码
数据分析自学小组成员 jeff 代码是这么写的:post
rlt = {}
for i in content:
rlt.setdefault(i,content.count(i))
复制代码
这里有一个你们以前没看到过、或没用过的方法 setdefault()
,你若是去搜python setdefault()
拿到它的说明,会发现它必定程度上至关于封装了方法2。学习
Python 字典 setdefault() 函数和 get()方法 相似, 若是键不存在于字典中,将会添加键并将值设为默认值。spa
这里分享一个小常识是,编程世界里,一门编程语言会自带不少封装好、高效、好用的函数、类、库等等,你根据本身需求去搜,就会找到它们。是的,方法几乎老是很是多的。code
做为零基础自学编程的人,你刚起步,你能够不知道 setdefault()
但你所掌握的基础功,足够让你能写出方法 1 或者 2。字符串
如今你可能会心急,怎么本身这个不知道,哪一个也没据说过?——不要紧的,你只要掌握:会拆解、勤搜索、多使用。使用也分两层,既能够本身多敲代码,也应该多读别人的代码,琢磨同一个需求的不一样实现方法,整理成相似这种笔记,而后点滴积累你的牛逼。get