关于机器学习所须要的测试数据集合

关于机器学习所须要的测试数据集合

 

Kaggle网址(用的最多):https://www.kaggle.com/datasetshtml

 

UCI数据集网址(其次): http://archive.ics.uci.edu/ml/git

 

scikit-learn网址(最少):http://scikit-learn.org/stable/datasets/index.html#datasetsgithub

 

训练数据数据库

一、计算机视觉机器学习

(1)人脸数据:学习

A、香港中文大学训练数据集:http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html  测试

此数据库包含了20w张人脸图片,每张图片标注了5个特征点、以及几十种属性(是否微笑、肤色、发色、性别等属性)网站

B、68我的脸特征点:http://ibug.doc.ic.ac.uk/resources/facial-point-annotations/code

此网站差很少能够下载到3000张,训练数据图片,每张图片标注了68我的脸特征点htm

C、74我的脸特征点:http://gaps-zju.org/DDE/ 

这个网站包好了1.4w张的人脸训练数据图片,每张图片标注了74我的脸特征点。不过这个数据感受标注的很不精确

D、性别与年龄训练数据:https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/

这个网站包含了500k+的人脸性别与年龄训练数据,同时还有文献及代码,对于搞性别年龄预测,资源充足

 

(2)深度估计、图像分割:

A、RGBD训练数据列表:http://www0.cs.ucl.ac.uk/staff/M.Firman/RGBDdatasets/

 

 

二、天然语言

(1)问答系统:https://github.com/karthikncode/nlp-datasets

相关文章
相关标签/搜索