大数据分析42万字的歌词,为了搞清楚民谣歌手们在唱些什么

“ 我选取了大约30个或比较大众,或比较小众的民谣歌手和乐队,包括李志,夭十三,赵雷,宋冬野,周云蓬,逃跑计划等等,为了设立参照,我还取了一些其他风格的乐队,比如老一些的汪峰,窦唯,朴树和新一些的低苦艾,谢天笑,反光镜,草东等等。 我首先写了一个爬虫,它可以根据歌手或乐队的名字来自动抓取这个歌手的所有歌,为了保证平衡,我最多只抓取前50首歌。 ” 这样,我得到了小一百个装满歌词的文件,我都能感觉到
相关文章
相关标签/搜索