[学习笔记] [数据分析] 01.Python入门

一、安装Python与环境配置python

数组

② 安装pip以及利用pip安装Python库网络

 

 

二、Anaconda安装数据结构

 

conda list 要在root环境下机器学习

三、经常使用数据分析库函数

① Numpypost

安装:conda install numpy (conda在Anaconda上安装,pip则是在本地上安装)学习

提供经常使用的数值、数组、矩阵函数。优化

基于“向量化”的运算,进行数值运算时比list高。spa

② Scipy

安装:conda install scipy

是一种使用NumPy来作高等数学、信号处理、优化、统计的扩展包

③ Pandas

安装:conda install pandas

也是基于Numpy的扩展包,支持CSV文件输入,整合时间序列,进行数据处理。

重要的数据结构:Series 和 DataFrame

具体操做:

显示整个表格全部行:head(),展现表格第一行:head(1)

展现表格的一些属性:

表格转秩:

对表格中某列进行排序:

④ Matplotlib

安装:conda install matplotlib

seaborn库

 

4、经常使用高级数据分析库

①nltk (Natural Language Toolkit)

pip install -U nltk

import nltk

下载预料库:nltk.download()

应用:文本提取、词汇切分、词频分析、词袋模型、情感分析

 

②igraph

研究社交网络的数据和图计算

pip install -U python-igraph

conda install -c marufr python-igraph=0.7.1.post6

 

③ scikit-learn

机器学习模型的训练 

是创建在scipy之上的一个用于机器学习的Python模块

pip install -U scikit-learn

conda install scikit-learn

 

5、Python2和Python3的区别

Python3的语言更加规范些

W3School Python 教程

相关文章
相关标签/搜索