做者:xiaoyuphp
微信公众号:Python数据科学python
知乎:python数据分析师git
学数据分析固然要先有数据,数据是分析的根本,否则一切都是空谈。若是是在公司里,获得数据垂手可得,由于公司有客户,有业务,必然会产生大量数据。但仅仅是我的学习的话,咱们如何获得数据呢?github
其实这也是好多正在学习数据分析的朋友常会遇到一个问题。一些朋友可能说爬虫能够解决。没错,确实能够经过爬虫来获取一部分信息,但也有局限性,而且每次都爬不但麻烦,也会遇到不少问题,毕竟咱们的重点是分析而不是爬虫。数据库
下面博主将珍藏的一些网上公开数据源作一个汇总,帮助有须要数据的朋友们。微信
Kaggle是无数数据挖掘爱好者喜好的竞赛平台,它的大标语是:your home for data science
。许多大公司与Kaggle合做,提供公开的数据源,并设立奖金,但愿数据挖掘爱好者们经过竞赛的方式提供最优方案,解决实际问题。所提供的奖金丰厚,给予比赛最好成绩的前三名选手。学习
固然,大部分人参加竞赛并非为了奖金而去,真实的目的是经过实战来提升本身的数据挖掘能力,在与世界各国的爱好者进行切磋的同时,开阔本身的眼界和视野,学习新知识。而且,这些大公司提供的数据源是很是有参考价值的,能够做为实战项目的首选,对求职者也是个很大的帮助。网站
https://tianchi.aliyun.com/spa
国内比较有名的数据挖掘平台了,它是一个数据科学家的社区,由阿里巴巴组织。赛事众多,有奖金支持,并云集了各路国内爱好者和高校研究者的参加。比赛设有初赛,复赛,决赛等关卡,有评委进行把关。平台一样也拥有大量免费的数据集供爱好者们使用。
一样也是数据科学的竞赛平台,报名后获取任务数据集,也是一个很是好的学习网站。
虽然竞赛人数和项目都通常,可是做为数据科学社区,提供免费的数据集。并能够在社区内进行技术交流和探讨。
https://knoema.com/
https://data.worldbank.org.cn/
关于世界宏观经济的两个网站,涵盖大量相关数据和学习资源。
数据来源于中国国家统计局,主要涉及我国经济民生等多个方面的数据,并在月度、季度、年度等多维度覆盖,较为全面和权威,对于社会科学的研究很是有帮助。
http://www.ceicdata.com/zh-hans
拥有超过128个国家的经济数据,能够很是精确地查找到各国GDP, CPI, 进口,出口,外资直接投资,零售,销售,以及国际利率等数据。其中,“中国经济数据库”收编了300,000多条时间序列数据,数据内容涵盖宏观经济数据、行业经济数据和地区经济数据。
万得有“中国Bloomberg”的称号,覆盖了全面的金融业数据,且类目更新很是快,受到不少商业分析者和投资人的亲睐。
拥有海量的统计资料,数量高达7,874本,同时涵盖了1,761,009张统计表格和364,580,480个统计数据,聚集了中国资讯行自92年以来收集的全部统计和调查数据。
国家统计局官网,聚集了海量的全国各级政府各年度的国民经济和社会发展统计信息,创建了以统计公报为主,统计年鉴、阶段发展数据、统计分析、经济新闻、主要统计指标排行等为辅助的多元化统计信息资料库,目前在线资料已达上万份。
一个研究成果共享的平台,来自世界的研究成果分享,同时有共享的研究数据。
https://www.openstreetmap.org/
经过这个网站能够下载世界各地的地图数据。
一样也是能够提供地图信息数据的网站;
https://github.com/caesar0301...
若是还嫌数据源不够,github上有位大神已经为你们整理好了一个很是全面的数据网站汇总,包含各个细分领域的数据资源(很是全),下面只是部分截图。
其实数据是无处不在的,须要咱们平时善于发现和观察。以上是本次向你们分享的免费数据网站,但愿对你们能有所帮助。
关注微信公众号:Python数据科学,发现更多精彩内容。