Elasticsearch7.X为何移除类型(type)

从Elasticsearch的第一个发布版本以来，每个文档都被存储在一个单独的索引里，并被赋予了一个type，一个映射类型表明着一个被索引的文档或实体的类型,例如，一个twitter索引可能有一个user类型和tweet类型。数据库

每种映射类型都有他本身的字段，因此user类型可能有一个full_name字段，一个user_name字段和一个email字段，而一个tweet类型可能有一个content字段，一个tweet_at字段，和user类型同样一个user_name字段。ui

每个文档类型都有一个_type元字段来存储type名称,而且根据URL里指定的类型名称，查询（搜索）被限定在一个或多个类型(type)里:spa

GET twitter/user,tweet/_search
{
  "query": {
    "match": {
      "user_name": "kimchy"
    }
  }
}

_type字段用来和文档的_id字段联合生成_uid字段，因此有着相同_id的不一样类型的文档能够存在同一个索引里。类型也用来创建文档间的父子关系，因此question类型的文档多是anser类型文档的父文档。code

起初，咱们说"索引"和关系数据库的“库”是类似的，“类型”和“表”是对等的。这是一个不正确的对比，致使了不正确的假设。在关系型数据库里,"表"是相互独立的,一个“表”里的列和另一个“表”的同名列没有关系，互不影响。但在类型里字段不是这样的。索引

在一个Elasticsearch索引里，全部不一样类型的同名字段内部使用的是同一个lucene字段存储。也就是说，上面例子中，user类型的user_name字段和tweet类型的user_name字段是存储在一个字段里的，两个类型里的user_name必须有同样的字段定义。文档

这可能致使一些问题，例如你但愿同一个索引中"deleted"字段在一个类型里是存储日期值，在另一个类型里存储布尔值。it

最后,在同一个索引中，存储仅有小部分字段相同或者所有字段都不相同的文档，会致使数据稀疏，影响Lucene有效压缩数据的能力。io

由于这些缘由，咱们决定从Elasticsearch中移除类型的概念。ast