数据分析——python基础

前言:python数据分析的基础知识,简单总结,主要是为了方便本身写的时候查看(大家可能看不太清楚T^T),发现有用的方法,随时补充,欢迎指正

数据分析专栏:python

  1. 数据分析——python基础
  2. 数据分析——numpy
  3. 数据分析——pandas
  4. 数据分析——数据可视化
  5. 数据分析——数据处理实例

python基础

一、三种基本数据类型

1.1列表

基础形式git

表示:List=[1,2,3]
索引:List[0]=1;List[:1]=[1,2];List[-1]=3

经常使用函数web

一、append添加一个元素
	List.append(2)
	
二、insert插入
	List.insert(1,2)在索引为1的位置增长2
	
三、remove删除
	List.remove(1)删除元素1
	
四、count计数
	List.count(1)输出1出现的次数
	
五、index位置索引
	List.index(1)输出1的位置
	
六、reverse倒序
	List.reverse()倒序输出
	
七、sort排序
	List.sort(reverse=True)降序输出
	List.sort(reverse=False)升序输出

1.2元组

cell=(1,2,3)--->不可像列表同样更改,索引等方法与列表相似

1.3字典

基础形式正则表达式

dict={'name'='Tom','age'='13'}
以键名进行索引,没有像列表同样的排序,能够认为是无序的
dict['name']=Tom

经常使用函数app

一、增长、修改
	其实增长和修改有不少方式,我这里主要讲两种方式:
	经过键直接修改、增长
		dict['sex']='male'//若是存在sex就修改,不存在就增长
	update函数
		dict.update({'name'='Try'})//同样,若是存在name就修改,不存在就增长
		
二、get得到键值
	dict.get('name')
	
三、dict.keys()输出全部的键

四、dict.values()输出全部的值

五、dict.items()输出全部键值对
#字典没有直接统计函数,能够用for循环+get统计,或者转换为df

二、判断、循环

  • if语句
if a>1:(无括号)
		****
	elif a<0:
		****
	else:
		****
  • while语句
while ****:(无括号)
		******
  • for语句
for i in range(1,6):(无括号)
		******
	for i in List:
		******

三、字符串

3.1经常使用函数

一、str[start:end:step]切片

二、split分割
	str='Try is so handsome'
	str.split('i')---->['Try ','s so handsome']
	
三、join拼接
	'-'.join('Try')---->T-r-y
	
四、count计数
	str.count('t')输出t出现的次数
	
五、删除空白strip、lstrip、rstrip
	str.strip()删除首尾空白
	
六、index索引位置
    str.index('t')输出t的位置,可能会报错
    
七、find找寻字串,不会报错(推荐使用)
若是包含子字符串返回开始的索引值,不然返回-1

八、统计字符串字母、数字的个数
    s=input("please inupt string") 
    print(s.isdigit()) #用isdigit函数判断是否数字 
    print(s.isalpha()) #isalpha判断是否字母 
    print(not (s.isalpha() or s.isdigit()) and s.isalnum()) #isalnum判断是否数字和字母的组合

3.2正则表达式

符号 含义
. 匹配任意字符串,除了\n
| 转义符,保留字符串中的特殊元字符
[ ] 字符组
\d 匹配任意数字
\s 匹配空白字符
\w 匹配字母和下划线
* 匹配前一个字符组0到无穷
+ 匹配前一个字符组1到无穷
匹配前一个字符组0到1

还有不少这里不一一列举!(正则表达式很重要)
补充:svg

一、findall函数
是找寻函数
re.findall()匹配的时候若是有括号,只能取到括号里面的内容,多个括号返回列表

二、search函数
re.search()函数将对整个字符串进行搜索,并返回第一个匹配的字符串的match对象

三、match函数
从头匹配,不匹配返回None

四、compile函数
compile 函数用于编译正则表达式,生成一个正则表达式( Pattern )对象
pattern = re.compile(r'\d+') 
 m = pattern.match('one12twothree34four')

【注】re.search()和re.match()函数返回match对象包括分组时,group(0)返回【完整匹配】的字符串,group(1)及以上分别返回各分组字符串。groups()函数返回各分组组成的元组对象
注:(.*?)匹配任意字符串

四、 函数

函数主要是参数的问题:
一、必选参数
必需要赋值的参数,不然调用函数报错函数

二、默认参数
函数已经赋值的参数,不可更改.net

三、可变参数指针

如add(*args)--->这里的*args就是可变参数,能够接受多个实参(如列表,能够简单的相似指针)

四、关键字参数code

add(**kwargs)----->这个就是针对字典的,**kwargs既能够接受多个实参,还能够把多个实参指定各自的实参名(这不就是字典吗???!)
相关文章
相关标签/搜索