WWM之殇:那些被掩盖的“##京”最后被我们用了吗?

平安科技举办2020中国大学生保险数字科技挑战赛的比赛在昨天落下帷幕,笔者在自然语言处理赛道的成绩是全榜第四,在这里做个比赛分享,记录一下历程。                          1.1 数据 比赛数据是经过加密的对话数据,如下图。主办方需要我们设计一个算法去识别客户的对话意图,也就是一个多分类问题,客户意图的类别高达56类,存在极大的样本不均衡问题。 1.2 算法思路 主办方的数
相关文章
相关标签/搜索