Python编程从入门到实践-------基础入门html
1、Python中的变量java
2、Python首字母大写使用title()方法,所有大写upper()方法,所有小写lower()方法python
3、Python中字符串拼接使用 + 号git
4、Python中删除字符串的空格 删除末尾空格的rstrip(),删除开头空格的lstrip(),删除两端空格的strip()编程
5、Python2与python3的print区别:app
6、Python中整数运算,使用两个乘号表示乘方运算机器学习
7、Python中避免类型错误使用str()函数,将其余类型值转化为字符串函数
8、Python中的注释工具
1、Python中的变量学习
变量名:大小写英文,数字和下划线的组合,不能以数字开头
2、Python首字母大写使用title()方法,所有大写upper()方法,所有小写lower()方法
>>> name='ce shi python'
>>> name.title();
'Ce Shi Python'
>>> print(name.upper())
CE SHI PYTHON
>>> name2="CE SHI PYTHON"
>>> print (name2.lower())
ce shi python
3、Python中字符串拼接使用 + 号
>>> first_name='ce'
>>> last_name="shi"
>>> full_name=first_name + last_name
>>> print(full_name)
ceshi
>>> print("Hello"+" "+full_name+" "+'welcome!')
Hello ceshi welcome!
4、Python中删除字符串的空格 删除末尾空格的rstrip(),删除开头空格的lstrip(),删除两端空格的strip()
>>> best_language=" python "
>>> best_language = best_language.rstrip()
>>> best_language
' python'
>>> best_language = best_language.lstrip()
>>> best_language
'python'
>>> best_language=" python "
>>> best_language
' python '
>>> best_language.strip()
'python'
5、Python2与python3的print区别:
python2中无需将要打印的内容放在括号内。python3中的print是一个函数,所以括号必不可少;有些python2的print也包含括号。
6、Python中整数运算,使用两个乘号表示乘方运算
>>> 3**2 #(=3*3)
>>> 10**3
1000
7、Python中避免类型错误使用str()函数,将其余类型值转化为字符串
>>> age = 25
>>> message = "Happy " + str(age) +" Birthday!"
>>> message
'Happy 25 Birthday!'
>>> print(message)
Happy 25 Birthday!
8、Python中的注释
以# 开头,后面的都是注释
基础
数据类型
Number整数/浮点数
String字符串
Boolean布尔值True和False
空值None不是0
Tuple元组类型没必要统一(1,‘abc’,0.4)
Dictionary key-value
List内置数据类型:列表[1,‘abc’,0.4],list是一种有序的集合,能够随时添加和删除其中的元素
变量
python是动态变量,不只能够是数字,还能够是任意数据类型,是引用
与之对应的是静态变量,java是静态变量
字符串
字符串能够用’'或者""括起来表示。
若是一个字符串包含不少须要转义的字符,对每个字符都进行转义会很麻烦。为了不这种状况,咱们能够在字符串前面加个前缀 r ,表示这是一个 raw 字符串,里面的字符就不须要转义了。
编程库
1.time
import time
print(time.time())
time = time.localtime( time.time() )
print(time)
print(time.tm_year)
"""
1563803665.310865
time.struct_time(tm_year=2019,XM代理申请http://www.fx61.com/brokerlist/xm.html tm_mon=7, tm_mday=22, tm_hour=21, tm_min=54, tm_sec=25, tm_wday=0, tm_yday=203, tm_isdst=0)
2019
"""
2.Matplotlib
绘图工具包
3.Scikit-learn
封装了大量经典以及最新的机器学习模型
4.Pandas
针对于数据处理和分析的python工具包,实现了大量便于数据读写,清洗,填充及分析功能
4.1读取文件
import pandas as pd
# 两个数据类型:Series, DataFrame
data_path = "C:/Users/admin/Desktop/111.csv"
# 读取文件
def read_file(data_path):
datas = pd.read_csv(data_path, encoding="GBK")
datas = datas.dropna()
return datas
data = read_file(data_path)
print(data)
# 获取某一列文字 Python 字典(Dictionary) -->contents_agent 转化成一整段
contents_agent = data["asr_agent_raw"]
contents = contents_agent.values.tolist()
5.jieba
import jieba
stopwords_file = "D:/gitProject/smartlink-sqc/smartlink-sqc-wordle/python/dict/user_dict.txt"
def seg_word(contents):
contents = contents.values.tolist()
jieba.load_userdict(stopwords_file)
segment = []
for line in contents:
try:
segs = jieba.lcut(line)
for seg in segs:
if len(seg) > 1 and seg != '\r\n' and \
u'\u4e00' <= seg <= u'\u9fa5' or \
u'\u0041' <= seg <= u'\u005a' or \
u'\u0061' <= seg <= u'\u007a':
segment.append(seg)
except:
print(line)
continue
words_df = pd.DataFrame({'words': segment})
stopwords = pd.read_csv(stopwords_file,
index_col=False,
quoting=3,
sep="\t",
names=['stopwords'],
encoding='utf-8') # quoting=3全不引用
words_df = words_df[~words_df.words.isin(stopwords.stopwords)]
return words_df
# 进行分词
words_agent = seg_word(contents_agent)
print(words_agent)
6.NumPy & SciPy
NumPy最基础的编程库,提供一些高级的数学运算机制和高效的向量和矩阵运算功能
SciPy是子啊NumPy的基础上构建的,更为强大的科学计算包
import numpy as np
def word_freq(words_df):
words_stat = words_df.groupby(by=['words'])['words'].agg({"count":np.size})
words_stat = words_stat.reset_index().sort_values(by=["count"], ascending=False)
return words_stat
words_stat_agent = word_freq(words_agent)
# 打印词频较高的前10
print(words_stat_agent.head(10))
7.Anaconda平台
一次性得到300多种用于科学和工程计算相关任务的python编程库的支持