KeyError: "word '\ufeff金融债务' not in vocabulary"

问题背景: python读取tongyici.txt文件时,控制台打印首行正常,但是在将第一个单词传入求近义词的时候,就会报错: 也就是tongyici.txt文件第一个单词‘金融债务’莫名的多了一个 \ufeff 前缀,怎么去掉这个前缀呢? 解决方案: 在读取tongyici.txt文件 时,指定编码方式由utf-8改为 "utf-8-sig"即可 如下: #批量找近义词 words = [li
相关文章
相关标签/搜索