windows下安装pippython
cd到 C:\Python27\Scripts目录下
执行 easy_install pip
安装完成后,在Scripts目录下生成pip工具算法
whl文件格式及安装方法
whl是一种压缩文件格式,其中包含py文件和编译后的pyd文件
安装whl包:pip install xxx.whl
更新whl包:pip install -U xxx.whlwindows
注意:安装whl包以前须要先安装wheel工具数组
安装wheel:pip install wheelapp
numpy下载连接:http://www.lfd.uci.edu/~gohlke/pythonlibs/机器学习
安装numpy:pip install numpy-xxx-xxx.whlide
错误记录:安装时,文件名中出现问号,多是因为编码问题致使,手动重命名文件后解决函数
scipy :SciPy是一款方便、易于使用、专为科学和工程设计的Python工具包.工具
它包括统计,优化,整合,线性代数模块,傅里叶变换,信号和图像处理,常微分方程求解器等等学习
安装Scipy函数库,SciPy依赖Numpy
下载连接:http://www.lfd.uci.edu/~gohlke/pythonlibs/
安装Scipy : pip install scipy-xxx-xxx.whl
matplotlib:Python绘图库,能够绘制直方图,功率谱,条形图,错误图,散点图等
安装matplotlib:直接运行 pip install matplotlib
或者下载whl安装包安装
下载地址:http://www.lfd.uci.edu/~gohlke/pythonlibs/
scikit-learn(简称sklearn):sklearn是Scipy的扩展,创建在NumPy和matplotlib库的基础上;支持包括分类、回归、降维和聚类四大机器学习算法。还包含了特征提取、数据处理和模型评估三大模块
安装:pip install -U scikit-learn
import numpy as np from sklearn.cluster import KMeans from sklearn.metrics import silhouette_score import matplotlib.pyplot as plt plt.subplot(3,2,1) #np.array()的类型是array x1=np.array([1,2,3,1,5,6,5,5,6,7,8,9,7,9]) x2=np.array([1,3,2,2,8,6,7,6,7,1,2,1,1,3]) #zip()函数,接收的参数是可迭代的对象 #返回的是一个list,list中的元素为元组 #zip(x1,x2)就是将两个数组中按顺序对应的数字组成一个元组 #返回的是 [(1,1),(2,3),(3,2)...] #此处若是将x1和x2定义为普通的list也可返回相同的list x=np.array(zip(x1,x2)).reshape(len(x1),2) #reshape()改变Array的维数,例如 #a = np.array([1,2,3,4,5,6,7,8]) #b = a.reshape(2,4) 形如:[[1,2,3,4],[5,6,7,8]] #c = a.reshape(2,2,2) 将a变成三维数组 plt.xlim([0,10]) plt.ylim([0,10]) plt.title('Instances') plt.scatter(x1,x2) colors=['b','g','r','c','m','y','k','b'] markers=['o','s','D','v','^','p','*','+'] clusters=[2,3,4,5,8] subplot_counter=1 sc_scores=[] for t in clusters : subplot_counter+=1 plt.subplot(3,2,subplot_counter) kmeans_model=KMeans(n_clusters=t).fit(x) for i,l in enumerate(kmeans_model.labels_): plt.plot(x1[i],x2[i],color=colors[l],marker=markers[l],ls='None') plt.xlim([0,10]) plt.ylim([0,10]) sc_score=silhouette_score(x,kmeans_model.labels_,metric='euclidean') sc_scores.append(sc_score) #程序运行出错,提示字符出错 plt.title('K=%s,silhouette coefficient= %0.03 f' % (t,sc_score)) plt.figure() plt.plot(clusters,sc_scores,'*-') plt.xlabel('Number of Cluster') plt.ylabel('Silhouette Coefficient Score') plt.show()