python基础和编程库

Python编程从入门到实践-------基础入门html

1Python中的变量java

2Python首字母大写使用title()方法,所有大写upper()方法,所有小写lower()方法python

3Python中字符串拼接使用 + git

4Python中删除字符串的空格 删除末尾空格的rstrip(),删除开头空格的lstrip(),删除两端空格的strip()编程

5Python2python3print区别:app

6Python中整数运算,使用两个乘号表示乘方运算机器学习

7Python中避免类型错误使用str()函数,将其余类型值转化为字符串函数

8Python中的注释工具

1Python中的变量学习

变量名:大小写英文,数字和下划线的组合,不能以数字开头

2Python首字母大写使用title()方法,所有大写upper()方法,所有小写lower()方法

>>> name='ce shi python'

>>> name.title();

'Ce Shi Python'

>>> print(name.upper())

CE SHI PYTHON

>>> name2="CE SHI PYTHON"

>>> print (name2.lower())

ce shi python

3Python中字符串拼接使用 +

>>> first_name='ce'

>>> last_name="shi"

>>> full_name=first_name + last_name

>>> print(full_name)

ceshi

>>> print("Hello"+" "+full_name+" "+'welcome!')

Hello ceshi welcome!

4Python中删除字符串的空格 删除末尾空格的rstrip(),删除开头空格的lstrip(),删除两端空格的strip()

>>> best_language=" python  "

>>> best_language = best_language.rstrip()

>>> best_language

' python'

>>> best_language = best_language.lstrip()

>>> best_language

'python'

>>> best_language=" python  "

>>> best_language

' python  '

>>> best_language.strip()

'python'

5Python2python3print区别:

python2中无需将要打印的内容放在括号内。python3中的print是一个函数,所以括号必不可少;有些python2print也包含括号。

6Python中整数运算,使用两个乘号表示乘方运算

>>> 3**2     #(=3*3)

>>> 10**3

1000

7Python中避免类型错误使用str()函数,将其余类型值转化为字符串

>>> age = 25

>>> message = "Happy " + str(age) +" Birthday!"

>>> message

'Happy 25 Birthday!'

>>> print(message)

Happy 25 Birthday!

8Python中的注释

# 开头,后面的都是注释

基础

数据类型

Number整数/浮点数

String字符串

Boolean布尔值TrueFalse

空值None不是0

Tuple元组类型没必要统一(1,abc,0.4)

Dictionary key-value

List内置数据类型:列表[1,abc,0.4],list是一种有序的集合,能够随时添加和删除其中的元素

变量

python是动态变量,不只能够是数字,还能够是任意数据类型,是引用

与之对应的是静态变量,java是静态变量

字符串

字符串能够用'或者""括起来表示。

若是一个字符串包含不少须要转义的字符,对每个字符都进行转义会很麻烦。为了不这种状况,咱们能够在字符串前面加个前缀 r ,表示这是一个 raw 字符串,里面的字符就不须要转义了。

编程库

1.time

import time

print(time.time())

time  = time.localtime( time.time() )

print(time)

print(time.tm_year)

"""

1563803665.310865

time.struct_time(tm_year=2019,XM代理申请http://www.fx61.com/brokerlist/xm.html tm_mon=7, tm_mday=22, tm_hour=21, tm_min=54, tm_sec=25, tm_wday=0, tm_yday=203, tm_isdst=0)

2019

"""

2.Matplotlib

绘图工具包

3.Scikit-learn

封装了大量经典以及最新的机器学习模型

4.Pandas

针对于数据处理和分析的python工具包,实现了大量便于数据读写,清洗,填充及分析功能

4.1读取文件

import pandas as pd

# 两个数据类型:Series,  DataFrame

 

data_path = "C:/Users/admin/Desktop/111.csv"

# 读取文件

def read_file(data_path):

    datas = pd.read_csv(data_path, encoding="GBK")

    datas = datas.dropna()

    return datas

data = read_file(data_path)

print(data)

# 获取某一列文字   Python 字典(Dictionary) -->contents_agent 转化成一整段

contents_agent = data["asr_agent_raw"]

contents = contents_agent.values.tolist()

5.jieba

import jieba

stopwords_file = "D:/gitProject/smartlink-sqc/smartlink-sqc-wordle/python/dict/user_dict.txt"

def seg_word(contents):

    contents = contents.values.tolist()

    jieba.load_userdict(stopwords_file)

    segment = []

    for line in contents:

        try:

            segs = jieba.lcut(line)

            for seg in segs:

                if len(seg) > 1 and seg != '\r\n' and \

                        u'\u4e00' <= seg <= u'\u9fa5' or \

                        u'\u0041' <= seg <= u'\u005a' or \

                        u'\u0061' <= seg <= u'\u007a':

                    segment.append(seg)

        except:

            print(line)

            continue

    words_df = pd.DataFrame({'words': segment})

    stopwords = pd.read_csv(stopwords_file,

                            index_col=False,

                            quoting=3,

                            sep="\t",

                            names=['stopwords'],

                            encoding='utf-8')   # quoting=3全不引用

    words_df = words_df[~words_df.words.isin(stopwords.stopwords)]

    return words_df

# 进行分词

words_agent = seg_word(contents_agent)

print(words_agent)

6.NumPy & SciPy

NumPy最基础的编程库,提供一些高级的数学运算机制和高效的向量和矩阵运算功能

SciPy是子啊NumPy的基础上构建的,更为强大的科学计算包

import numpy as np

def word_freq(words_df):

    words_stat = words_df.groupby(by=['words'])['words'].agg({"count":np.size})

    words_stat = words_stat.reset_index().sort_values(by=["count"], ascending=False)

    return words_stat

words_stat_agent = word_freq(words_agent)

# 打印词频较高的前10

print(words_stat_agent.head(10))

7.Anaconda平台

一次性得到300多种用于科学和工程计算相关任务的python编程库的支持

相关文章
相关标签/搜索