Jupyter notebook

Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本,支持运行 40 多种编程语言。使用浏览器做为界面,向后台的IPython服务器发送请求,并显示结果。 Jupyter Notebook 的本质是一个 Web 应用程序,便于建立和共享文学化程序文档,支持实时代码,数学方程,可视化和 markdown。 python

IPython 是一个 python 的交互式 shell,比默认的python shell 好用得多,支持变量自动补全,自动缩进,支持 bash shell 命令,内置了许多颇有用的功能和函数。shell

安装ipython编程

windows: 前提是有numpy,matplotlib pandas json

采用pip安装 pip install ipythonwindows

OS X: AppStore下载安装苹果开发工具Xcode。浏览器

使用easy_install或pip安装IPython,或者从源文件安装。bash

安装Jupyter notebook服务器

  pip3 install jupytermarkdown

数据读取与存储

读取与存储csv:编程语言

# filepath 文件路径。该字符串能够是一个URL。有效的URL方案包括http,ftp和file 
# sep 分隔符。read_csv默认为“,”,read_table默认为制表符“[Tab]”。
# header 接收int或sequence。表示将某行数据做为列名。默认为infer,表示自动识别。
# names 接收array。表示列名。
# index_col 表示索引列的位置,取值为sequence则表明多重索引。 
# dtype 表明写入的数据类型(列名为key,数据格式为values)。
# engine 接收c或者python。表明数据解析引擎。默认为c。
# nrows 接收int。表示读取前n行。

pd.read_table(
    filepath_or_buffer, sep='\t', header='infer', names=None, 
    index_col=None, dtype=None, engine=None, nrows=None) 
pd.read_csv(
    filepath_or_buffer, sep=',', header='infer', names=None, 
    index_col=None, dtype=None, engine=None, nrows=None)
DataFrame.to_csv(excel_writer=None, sheetname=None, header=True, index=True, index_label=None, mode=’w’, encoding=None) 

读取与存储excel:

# io 表示文件路径。
# sheetname 表明excel表内数据的分表位置。默认为0。 
# header 接收int或sequence。表示将某行数据做为列名。默认为infer,表示自动识别。
# names 表示索引列的位置,取值为sequence则表明多重索引。
# index_col 表示索引列的位置,取值为sequence则表明多重索引。
# dtype 接收dict。数据类型。
pandas.read_excel(io, sheetname=0, header=0, index_col=None, names=None, dtype=None)
DataFrame.to_excel(excel_writer=None, sheetname=None, header=True, index=True, index_label=None, mode=’w’, encoding=None) 

读取与存储JSON:

# 经过json模块转换为字典,再转换为DataFrame
pd.read_json('../ratings.json')
相关文章
相关标签/搜索