在入门NLP以前,博主也是一头雾水,数据集不知道从哪里来,模型无法训练,故而对于模型及算法的细节得不到实现,更看不到模型运行后的效果,因此博主简单总结如下几点,当缺乏数据集时该怎么办?算法
1.若是你的方向是CV,那么通常是对现有的数据作数据加强,图片作各类旋转、斜切、曝光等;不过最好的方式仍是经过使用胶囊网络来进行学习,经过学习到各类角度问题来解决数据不足的问题;网络
2.若是你的方向是NLP,经过爬虫去收集一些商品或店铺的评价及分数,经常使用的爬虫有bs4,scrapy等经常使用框架,若有学习的须要,私聊我(超详细的资料哦);框架
3.互联网知名比赛所用数据集或其余公开的数据集,好比天池等,博主已经收集CV、NLP等一些经常使用的任务的数据集,若有须要,私聊我哦);scrapy