Databook-数据之书

Databook-数据之书

用于数据分析的Jupyter Notebooks。html

快速建立步骤

  • 建立一个 github.com 帐号。
  • 复制本代码仓库到本身的repository,点击fork便可。
  • 打开 https://mybinder.org , 填入上面的github repository地址,点击“launch”开始构建本身的远程服务。
  • 服务网页打开后,将后缀/tree改成/lab,以使用最新的多窗口界面。
  • 添加notebook, 而后运行、修改,shift+enter便可执行cell中的代码。
  • 提交更新到本身的 github repository, 经过运行 ./commit.sh。
  • https://github.com/databooks/databook 拉取更新, 运行 ./upstream-pull.sh.
  • 提交一个 pull-request, 将本身的 notebook 合并到上游 upstream, 须要从 github webUI上操做。

运行到k8s集群

该项目能够运行到本身的k8s集群之中,须要构建从新为jupyterhub-k8s构建镜像和部署。   python

参考:git

快速使用教程

安装的支持库

  • jupyter, 包含 notebook, jupyterhub, jupyterlab webUI.
  • conda, 功能强大的python科学数据分析版, 使用 miniconda更小,只包含基本安装包。
  • mlflow,使用 mlflow进行机器学习,该库由databricks公司进行开发。
  • airflow, 数据流水线处理工具-airflow, 由Apache Software Foundation资助开发。
  • tushare, 金融数据获取sdk,提供中国金融相关数据, 基于python api。
  • matplotlib, 图形绘制库,在 jupyter notebook 中使用,先执行 %matplotlib inline。
  • ipyleaflet , 在Jupyter Notebook中显示地图,提供jupyterlab extension, 是 jupyter-widgets的一部分。

更多资源

相关文章
相关标签/搜索