python基础和编程库

时间 2019-11-18

标签 python 基础编程栏目 Python 繁體版

原文原文链接

Python编程从入门到实践-------基础入门html

1、Python中的变量java

2、Python首字母大写使用title()方法，所有大写upper()方法，所有小写lower()方法python

3、Python中字符串拼接使用 + 号git

4、Python中删除字符串的空格删除末尾空格的rstrip(),删除开头空格的lstrip(),删除两端空格的strip()编程

5、Python2与python3的print区别:app

6、Python中整数运算，使用两个乘号表示乘方运算机器学习

7、Python中避免类型错误使用str()函数,将其余类型值转化为字符串函数

8、Python中的注释工具

1、Python中的变量学习

变量名：大小写英文，数字和下划线的组合，不能以数字开头

2、Python首字母大写使用title()方法，所有大写upper()方法，所有小写lower()方法

>>> name='ce shi python'

>>> name.title();

'Ce Shi Python'

>>> print(name.upper())

CE SHI PYTHON

>>> name2="CE SHI PYTHON"

>>> print (name2.lower())

ce shi python

3、Python中字符串拼接使用 + 号

>>> first_name='ce'

>>> last_name="shi"

>>> full_name=first_name + last_name

>>> print(full_name)

ceshi

>>> print("Hello"+" "+full_name+" "+'welcome!')

Hello ceshi welcome!

4、Python中删除字符串的空格删除末尾空格的rstrip(),删除开头空格的lstrip(),删除两端空格的strip()

>>> best_language=" python "

>>> best_language = best_language.rstrip()

>>> best_language

' python'

>>> best_language = best_language.lstrip()

>>> best_language

'python'

>>> best_language=" python "

>>> best_language

' python '

>>> best_language.strip()

'python'

5、Python2与python3的print区别:

python2中无需将要打印的内容放在括号内。python3中的print是一个函数，所以括号必不可少；有些python2的print也包含括号。

6、Python中整数运算，使用两个乘号表示乘方运算

>>> 3**2 #(=3*3)

>>> 10**3

1000

7、Python中避免类型错误使用str()函数,将其余类型值转化为字符串

>>> age = 25

>>> message = "Happy " + str(age) +" Birthday!"

>>> message

'Happy 25 Birthday!'

>>> print(message)

Happy 25 Birthday!

8、Python中的注释

以# 开头，后面的都是注释

基础

数据类型

Number整数/浮点数

String字符串

Boolean布尔值True和False

空值None不是0

Tuple元组类型没必要统一(1,‘abc’,0.4)

Dictionary key-value

List内置数据类型:列表[1,‘abc’,0.4],list是一种有序的集合，能够随时添加和删除其中的元素

变量

python是动态变量,不只能够是数字，还能够是任意数据类型,是引用

与之对应的是静态变量,java是静态变量

字符串

字符串能够用’'或者""括起来表示。

若是一个字符串包含不少须要转义的字符，对每个字符都进行转义会很麻烦。为了不这种状况，咱们能够在字符串前面加个前缀 r ，表示这是一个 raw 字符串，里面的字符就不须要转义了。

编程库

1.time

import time

print(time.time())

time = time.localtime( time.time() )

print(time)

print(time.tm_year)

"""

1563803665.310865

time.struct_time(tm_year=2019,XM代理申请http://www.fx61.com/brokerlist/xm.html tm_mon=7, tm_mday=22, tm_hour=21, tm_min=54, tm_sec=25, tm_wday=0, tm_yday=203, tm_isdst=0)

2019

"""

2.Matplotlib

绘图工具包

3.Scikit-learn

封装了大量经典以及最新的机器学习模型

4.Pandas

针对于数据处理和分析的python工具包,实现了大量便于数据读写,清洗,填充及分析功能

4.1读取文件

import pandas as pd

# 两个数据类型：Series, DataFrame

data_path = "C:/Users/admin/Desktop/111.csv"

# 读取文件

def read_file(data_path):

datas = pd.read_csv(data_path, encoding="GBK")

datas = datas.dropna()

return datas

data = read_file(data_path)

print(data)

# 获取某一列文字 Python 字典(Dictionary) -->contents_agent 转化成一整段

contents_agent = data["asr_agent_raw"]

contents = contents_agent.values.tolist()

5.jieba

import jieba

stopwords_file = "D:/gitProject/smartlink-sqc/smartlink-sqc-wordle/python/dict/user_dict.txt"

def seg_word(contents):

contents = contents.values.tolist()

jieba.load_userdict(stopwords_file)

segment = []

for line in contents:

try:

segs = jieba.lcut(line)

for seg in segs:

if len(seg) > 1 and seg != '\r\n' and \

u'\u4e00' <= seg <= u'\u9fa5' or \

u'\u0041' <= seg <= u'\u005a' or \

u'\u0061' <= seg <= u'\u007a':

segment.append(seg)

except:

print(line)

continue

words_df = pd.DataFrame({'words': segment})

stopwords = pd.read_csv(stopwords_file,

index_col=False,

quoting=3,

sep="\t",

names=['stopwords'],

encoding='utf-8') # quoting=3全不引用

words_df = words_df[~words_df.words.isin(stopwords.stopwords)]

return words_df

# 进行分词

words_agent = seg_word(contents_agent)

print(words_agent)

6.NumPy & SciPy

NumPy最基础的编程库,提供一些高级的数学运算机制和高效的向量和矩阵运算功能

SciPy是子啊NumPy的基础上构建的,更为强大的科学计算包

import numpy as np

def word_freq(words_df):

words_stat = words_df.groupby(by=['words'])['words'].agg({"count":np.size})

words_stat = words_stat.reset_index().sort_values(by=["count"], ascending=False)

return words_stat

words_stat_agent = word_freq(words_agent)

# 打印词频较高的前10

print(words_stat_agent.head(10))

7.Anaconda平台

一次性得到300多种用于科学和工程计算相关任务的python编程库的支持