GitHub上最全中华古诗词数据库又火了

  <a href="https://www.ithome.com/" target="_blank">IT 之家</a> 12 月 26 日消息 近期,GitHub 上最全中华古诗词数据库再次登上热榜,又火了一把。根据介绍,chinese-poetry 最全中华古诗词数据库集合了唐宋两朝近一万四千古诗人, 接近 5.5 万首唐诗加 26 万宋诗. 两宋时期 1564 位词人,21050 首词。该项目已经得到了 22.6k 个「star」以及 4.2k 个「fork」。
  GitHub 项目:<a href="https://github.com/chinese-poetry/chinese-poetry">https://github.com/chinese-poetry/chinese-poetry</a>;
  最全的中华古典文集数据库,包含 5.5 万首唐诗、26 万首宋诗、2.1 万首宋词和其余古典文集。诗人包括唐宋两朝近 1.4 万古诗人,和两宋时期 1.5 千古词人。数据来源于互联网。
  为何要作这个仓库? 项目做者表示,古诗是中华民族乃至全世界的瑰宝,咱们应该传承下去,虽然有古典文集,但大多数人并无拥有这些书籍。从某种意义上来讲,这些庞大的文集离咱们是有必定距离的。而电子版方便拷贝,因此此开源数据库诞生了。此数据库经过 JSON 格式分发,能够让你很方便的开始你的项目。
  古诗采集没有记录过程,由于古诗数据庞大,目标网站有限制,采集过程常常中断超过了一个星期。2017 年新加入全宋词,<a href="https://jackeygao.github.io/r/words/crawl-ci.html" target="_blank">全宋词爬取过程及数据分析。</a>
  <strong>高频词分析图</strong>
  宋词受欢迎的词牌名
  宋词高频词
  宋词做者做品榜
  唐诗高频词
  唐诗做者做品榜
  宋诗高频词
  宋诗做者做品榜
  <strong>数据集</strong>html

相关文章
相关标签/搜索