数据挖掘学习

数据挖掘基础环境安装与使用

  • 完成数据挖掘基础阶段的全部环境安装
  • 应用jupyter notebook完成代码编写运行

1.1 库的安装

学习目标

  • 目标
    • 搭建好数据挖掘基础阶段的环境
  • 应用

整个数据挖掘基础阶段会用到Matplotlib、Numpy、Pandas、Ta-Lib等库,为了统一版本号在环境中使用,将全部的库及其版本放到了文件requirements.txt当中,而后统一安装python

新建一个用于人工智能环境的虚拟环境程序员

mkvirtualenv -p /user/local/bin/python3 ai
matplotlib==2.2.2 numpy==1.14.2 pandas==0.20.3 TA-Lib==0.4.16 tables==3.4.2 jupyter==1.0.0 

Ta-Lib安装会出现问题,须要先安装依赖库,按照如下步骤安装:编程

# 获取源码库 sudo wget http://prdownloads.sourceforge.net/ta-lib/ta-lib-0.4.0-src.tar.gz # 解压进入目录 tar -zxvf ta-lib-0.4.0-src.tar.gz cd ta-lib/ # 编译安装 sudo ./configure --prefix=/usr sudo make sudo make install # 从新安装python的TA-Lib库 pip install TA-Lib 

使用pip命令安装浏览器




pip install -r requirements.txt

1.2 Jupyter Notebook使用

学习目标

  • 目标
    • 学会使用Jupyter Notebook编写运行代码
  • 应用
    • 建立文件
    • 操做cell
    • 运行操做

1.2.1 Jupyter Notebook介绍

Jupyter项目是一个非盈利的开源项目,源于2014年的ipython项目,由于它逐渐发展为支持跨全部编程语言的交互式数据科学和科学计算bash

  • Jupyter Notebook,原名IPython Notbook,是IPython的增强网页版,一个开源Web应用程序
  • 名字源自Julia、Python 和 R(数据科学的三种开源语言)
  • 是一款程序员和科学工做者的编程/文档/笔记/展现软件
  • .ipynb文件格式是用于计算型叙述的JSON文档格式的正式规范

1.2.2 为何使用Jupyter Notebook?

  • 传统软件开发:工程/目标明确
    • 需求分析,设计架构,开发模块,测试
  • 数据挖掘:艺术/目标不明确
    • 目的是具体的洞察目标,而不是机械的完成任务
    • 经过执行代码来理解问题
    • 迭代式地改进代码来改进解决方法

实时运行的代码、叙事性的文本和可视化被整合在一块儿,方便使用代码和数据来说述故事markdown

对比Jupyter Notebook和Pycharm架构

  • 画图

1.2.3 Jupyter Notebook的使用-helloworld

1 界面启动、建立文件

  • 界面启动

环境搭建好后,本机输入jupyter notebook命令,会自动弹出浏览器窗口打开Jupyter Notebook编程语言

 

# 进入虚拟环境
workon ai
# 输入命令
jupyter notebook

本地notebook的默认URL为:http://localhost:8888学习

想让notebook打开指定目录,只要进入此目录后执行命令便可测试

 

新建notebook文档

  • notebook的文档格式是.ipynb

 

  • 内容界面操做-helloworld

 

标题栏:点击标题(如Untitled)修改文档名 菜单栏

  • 导航-File-Download as,另存为其余格式
  • 导航-Kernel
    • Interrupt,中断代码执行(程序卡死时)
    • Restart,重启Python内核(执行太慢时重置所有资源)
    • Restart & Clear Output,重启并清除全部输出
    • Restart & Run All,重启并从新运行全部代码

2 cell操做

什么是cell?

cell:一对In Out会话被视做一个代码单元,称为cell

Jupyter支持两种模式:

  • 编辑模式(Enter)
    • 命令模式下回车Enter鼠标双击cell进入编辑模式
    • 能够操做cell内文本或代码,剪切/复制/粘贴移动等操做
  • 命令模式(Esc)
    • Esc退出编辑,进入命令模式
    • 能够操做cell单元自己进行剪切/复制/粘贴/移动等操做

1)鼠标操做

 

2)快捷键操做

  • 两种模式通用快捷键
    • Shift+Enter,执行本单元代码,并跳转到下一单元
    • Ctrl+Enter,执行本单元代码,留在本单元

cell行号前的 * ,表示代码正在运行

  • 命令模式:按ESC进入
    • Y,cell切换到Code模式
    • M,cell切换到Markdown模式
    • A,在当前cell的上面添加cell
    • B,在当前cell的下面添加cell
    • 双击D:删除当前cell
    • Z,回退
    • L,为当前cell加上行号 <!--
    • Ctrl+Shift+P,对话框输入命令直接运行
    • 快速跳转到首个cell,Crtl+Home
    • 快速跳转到最后一个cell,Crtl+End -->
  • 编辑模式:按Enter进入
    • 多光标操做:Ctrl键点击鼠标(Mac:CMD+点击鼠标)
    • 回退:Ctrl+Z(Mac:CMD+Z)
    • 重作:Ctrl+Y(Mac:CMD+Y)
    • 补全代码:变量、方法后跟Tab键
    • 为一行或多行代码添加/取消注释:Ctrl+/(Mac:CMD+/)
    • 屏蔽自动输出信息:可在最后一条语句以后加一个分号

 

3 markdown演示

掌握标题和缩进便可

一级标题

二级标题

三级标题

四级标题

五级标题
  • 缩进
    • 二级缩进
      • 三级缩进
相关文章
相关标签/搜索