常见的语言表示模型(词嵌入、句表示、篇章表示)

语言表示方法大体上可以从两个维度进行区分。一个维度是按不同粒度进行划分,语言具有一定的层次结构,语言表示可以分为字、词、句子、篇章等不同粒度的表示。另一个维度是按表示形式进行划分,可以分为离散表示和连续表示两类。离散表示是将语言看成离散的符号,而将语言表示为连续空间中的一个点,包括分布式表示和分散式表示。 一、离散表示 1、词向量 一个词可以表示为One-Hot 向量(一维为1 其余维为0 的向量
相关文章
相关标签/搜索