利用元数据管理数据质量

什么是元数据
       任何文件系统中的数据分为数据和元数据。数据是指普通文件中的实际数据,而元数据指用来描述一个文件的特征的系统数据,诸如访问权限、文件拥有者以及文件数据块的分布信息(inode...)等等。在集群文件系统中,分布信息包括文件在磁盘上的位置以及磁盘在集群中的位置。用户须要操做一个文件必须首先获得它的元数据,才能定位到文件的位置而且获得文件的内容或相关属性。
元数据管理方式
       元数据管理有两种方式。集中式管理和分布式管理。集中式管理是指在系统中有一个节点专门司职元数据管理,全部元数据都存储在该节点的存储设备上。全部客户端对文件的请求前,都要先对该元数据管理器请求元数据。分布式管理是指将元数据存放在系统的任意节点而且能动态的迁移。对元数据管理的职责也分布到各个不一样的节点上。大多数集群文件系统都采用集中式的元数据管理。由于集中式管理实现简单,一致性维护容易,在必定的操做频繁度内能够提供较满意的性能。缺点是单一失效点问题,若该服务器失效,整个系统将没法正常工做。并且,当对元数据的操做过于频繁时,集中的元数据管理成为整个系统的性能瓶颈。
       分布式元数据管理的好处是解决了集中式管理的单一失效点问题, 并且性能不会随着操做频繁而出现瓶颈。其缺点是,实现复杂,一致性维护复杂,对性能有必定影响。node

 

如何利用元数据管理数据质量:点击这里数据库

更多精品课程:服务器

云数据库Redis版使用教程负载均衡

玩转云存储对象存储OSS使用入门分布式

阿里云CDN使用教程性能

负载均衡入门与产品使用指南网站

阿里云大学官网(阿里云大学 - 官方网站,云生态下的创新人才工场阿里云

相关文章
相关标签/搜索