Kaggle网址(用的最多):https://www.kaggle.com/datasetshtml
UCI数据集网址(其次): http://archive.ics.uci.edu/ml/git
scikit-learn网址(最少):http://scikit-learn.org/stable/datasets/index.html#datasetsgithub
训练数据数据库
一、计算机视觉机器学习
(1)人脸数据:学习
A、香港中文大学训练数据集:http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html 测试
此数据库包含了20w张人脸图片,每张图片标注了5个特征点、以及几十种属性(是否微笑、肤色、发色、性别等属性)网站
B、68我的脸特征点:http://ibug.doc.ic.ac.uk/resources/facial-point-annotations/code
此网站差很少能够下载到3000张,训练数据图片,每张图片标注了68我的脸特征点htm
C、74我的脸特征点:http://gaps-zju.org/DDE/
这个网站包好了1.4w张的人脸训练数据图片,每张图片标注了74我的脸特征点。不过这个数据感受标注的很不精确
D、性别与年龄训练数据:https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/
这个网站包含了500k+的人脸性别与年龄训练数据,同时还有文献及代码,对于搞性别年龄预测,资源充足
(2)深度估计、图像分割:
A、RGBD训练数据列表:http://www0.cs.ucl.ac.uk/staff/M.Firman/RGBDdatasets/
二、天然语言