胖子哥的大数据之路(二)- 大数据结构化数据存储应用模式

1、楔子数据库

  胖子哥是我网名,叫了不少年的网名,网名的来历与本身的沧桑和身材有关,不知是IT改变了我,显得苍老,还 是我本就苍老,顺应了IT行业的须要。25岁那面,曾被跟我同样高的漂亮美眉叫叔叔,今后不再敢打小姑娘的注意,走上了重口味热爱阿姨级别女性的不归 路;曾被三十5、六岁的同事阿姨说苍老:看你也就三十五六吧,那年我25;周一的时候,还有一个60后的同事问及个人年龄,他很含蓄的,明显带着保留的口 吻问我:你是75年的吧?由于他一直认为和我通常大。而后...而后泪奔。关于体型方面也是个悲剧、三围相等,体重大于身高的角色,算是已经胖出了必定层 次,每次听到别人叫我胖子,就感受小小的自尊多少受到了伤害,而后就给本身在后面加了一个哥子,算是给本身遮半张脸吧。闲话就聊到这里,仍是继续胖子哥的 大数据之路吧,此次要谈的仍是数据仓库。分布式

2、实时查询数据库-HDFS&HBase大数据

  传统关系型数据库基于存储模式的问题带来的存储和访问瓶颈,是没法靠自身解决的,也就有了基于Big-Table型的NoSQL数据库用武之地,比较典型技术组合就是HDFS+HBase, 利用HDFS的分布式、高可用数据存储,结合HBase面向列的数据存储模型,从而解决大数据量存储的问题;结合HBase基于Rowkey天然序的存 储,从而实现海量数据快速查询。固然这种模式只适用于结构型数据,并且只适用于历史数据查询,而不适用于事务型业务的处理,从而产生了大数据在结构化数据存储方面的第一种模式:实时查询数据库;事务

3、大数据仓库-HDFS&Hive高可用

  基于关系型数据库的数据仓库,一样面临数据存储规模的问题,所以在银行业务中,一样也只能存储短时间的数据,其目标在在于支持基于业务年度的报表统计和业务分析,而对于超过必定期限的数据仍然在走数据磁盘或磁带存储的模式。基于大数据技术体系,采用HDFS+Hive的模式,构建大数据仓库,则能够很轻松的解决数据大基数存储的问题。从而产生了大数据在结构化数据数据存储方面的第二种模式:大数据仓库;技术

4、替换仍是互补-你们来回答,期待你的答案统计

  问题一数据

  实时查询数据库可否替换实时操做数据库吗?关系型数据库

  问题二项目

  大数据仓库能够替代数据仓库吗?

5、关于大数据题外话  

  曾经就干货与湿货的问题,与人发生过争辩,仍是不淡定了。其实对于一个口渴的人,水就是干货,一样,对于一个迷路的人,指南针就是干货。见仁见智的事,再也不作争辩。重在分享,送给大数据传统企业应用实施的探路者们,送给须要的人,立此存照。

  持续更新中,未完待续。。。。

  下期预告:大数据仓库项目的需求分析该如何去作。敬请期待。

相关文章
相关标签/搜索