一、安装Python与环境配置python
①数组
② 安装pip以及利用pip安装Python库网络
二、Anaconda安装数据结构
conda list 要在root环境下机器学习
三、经常使用数据分析库函数
① Numpypost
安装:conda install numpy (conda在Anaconda上安装,pip则是在本地上安装)学习
提供经常使用的数值、数组、矩阵函数。优化
基于“向量化”的运算,进行数值运算时比list高。spa
② Scipy
安装:conda install scipy
是一种使用NumPy来作高等数学、信号处理、优化、统计的扩展包
③ Pandas
安装:conda install pandas
也是基于Numpy的扩展包,支持CSV文件输入,整合时间序列,进行数据处理。
重要的数据结构:Series 和 DataFrame
具体操做:
显示整个表格全部行:head(),展现表格第一行:head(1)
展现表格的一些属性:
表格转秩:
对表格中某列进行排序:
④ Matplotlib
安装:conda install matplotlib
seaborn库
4、经常使用高级数据分析库
①nltk (Natural Language Toolkit)
pip install -U nltk
import nltk
下载预料库:nltk.download()
应用:文本提取、词汇切分、词频分析、词袋模型、情感分析
②igraph
研究社交网络的数据和图计算
pip install -U python-igraph
conda install -c marufr python-igraph=0.7.1.post6
③ scikit-learn
机器学习模型的训练
是创建在scipy之上的一个用于机器学习的Python模块
pip install -U scikit-learn
conda install scikit-learn
5、Python2和Python3的区别
Python3的语言更加规范些
W3School Python 教程