Python数据分析开发环境

准备工做

下载并安装最新版本的Anacondahtml

下载并安装最新版本的Visual Studio Codepython

编辑器

Tips:git

能够选择本身喜欢而且熟悉的编辑器或IDE。如:VIM、Emacs、Notepad++、Sublime、Pycharm等。github

若是安装的是完整版本的Anaconda,会默认安装Spyder以及Jupyter Notebook。那么不想折腾编辑器的话,推荐使用这两款应用是足够的。sql

Visual Studio Code

推荐插件数据库

  • Python

可选插件windows

  • vscode-icons

包管理器选择

Conda

Conda是目前比较经常使用的包管理工具,其大体功用于pip相似,这里使用Conda的缘由,主要在于Conda除能够安装python的包外,还能够很方便的安装其余变成语言的包(如C++、C等)。这样的话,就能够很方便的解决有些数据分析的包依赖非python编写的程序包的问题。visual-studio-code

为了可以直接在命令行中使用conda命令,这里将Anaconda3\Scripts目录添加到了环境变量中。编辑器

基本使用

建立虚拟环境:conda create -n <env_name> python=<python_version_num>工具

激活虚拟环境:activate <env_name>

安装程序包到指定虚拟环境:conda install -n <env_name> <pakcage_name>

关闭虚拟环境:deactivate

删除虚拟环境:conda remove <env_name> --all

删除虚拟环境中的某个包:conda remove --name <env_name> <package_name>

查看已安装包:conda list

查看已安装环境:conda env list

检查更新conda:conda update conda

更新全部程序包:conda update --all

经常使用包安装

安装好Anaconda后,可使用Anaconda来管理包的安装。

若是是用于学习与研究,而不用与其余人协做或者可以有良好的约定的话,那么能够直接使用conda的默认的环境,这样就能够少安装不少包。

REM 基础包

conda install numpy
conda install scipy
conda install pandas
conda install matplotlib

REM ORM,用于链接数据库

conda install sqlalchemy

更改Conda的下载镜像

若是要使用的包并不包含在默认的conda环境中,又想加快下载速度与稳定性的话,能够添加国内的下载镜像。

在终端中执行如下命令:

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/

conda config --set show_channel_urls yes

参考:

  1. Anaconda 镜像使用帮助

PIP

由于某些缘由使用Conda可能没法顺利安装一些包,那么可使用PIP来进行安装。

REM 更新PIP

python -m pip install --upgrade pip

REM 中国股票数据获取

pip install tushare

REM 导出当前环境全部依赖包信息

pip freeze > requirements.txt

REM 根据导出的依赖包信息安装包

pip install -r requirements.txt -d <your_download_dir>

经常使用包推荐

数据获取&爬虫

  • Tushare:提供便捷的国内股票行情数据的获取(自动爬取相关网站数据)
  • requests:一款优秀的HTTP Request包,能够用于与HTML/XML解析的包结合起来制做爬虫工具。
  • urllib:Python3的内置包,主要用于访问、解析指定URL。
  • Beautiful Soup:一个能够从HTML或XML文件中提取数据的Python库。

数据整理

  • Numpy:提供强大的矩阵操做,以及一些很是有用的计算工具(如:irr、npv等)
  • Pandas:提供强大的数据框操做(相似R语言中的DataFrame)
  • SciPy:提供强大的统计工具。

数据可视化

数据库操做

  • sqlalchemy:数据库建议使用本身熟悉的或项目统一要求的,如:Oracle、MySQL、PostgreSQL、MSSQL、SQLite等。sqlalchemy包能够有效的链接各种经常使用的数据库,并处理各种操做。
相关文章
相关标签/搜索