宅男程序员给老婆的计算机课程之4:SQL vs NoSQL

男主角:Wuvist(新浪微博),真名翁伟,自称胖程序员一个,幸亏已婚。学习.NET出身,现经常使用Python作服务器端开发,曾任新加坡某创业公司主程。公司被Techcrunch blog事后,以为新加坡生活太过安逸,终于在去年辞职只身回家乡汕头创业,活跃于珠三角技术沙龙,热衷于与其余技术宅分享。前端

Wuvist

本文做者:Wuvistmysql

女主角:Katze,Wuvist的老婆,女程序员,在某跨国投行任Unix系统管理员,常被Wuvist嘲笑技术太差。程序员

【51CTO独家特稿】在几乎全部的web应用中,数据库都是核心的一环。web

Web应用每每都是“Database driven”,业务、数据都是由数据库完成,而前端页面仅仅是演示、修改数据的一个“壳”。redis

所以不少web框架,都会标榜本身可以兼容多少多少数据库,作CRUD多么多么容易。sql

通常上,提到数据库的时候,指的都是关系型数据库;但关系型数据库并不是惟一的一种数据库类型。数据库

关系型数据库,一开始即是设计为通用,并有ACID支持的。编程

Atomicity 原子性、 Consistency 一致性、Isolation 隔绝性、Durability 持久性后端

杀手欧阳盆栽说:“每件事都有它的代价”。上述四个特性,都是有代价的。设计模式

对于严谨的商业应用,如银行、交易系统;为求业务的安全,他们不得不,或者说,可以而且愿意付出这些代价。

回到12306,后端数据库传说使用的是Oracle,而站出来讲吐槽12306的行家每每都会提到 redis \ mysql 这样的替代。

有些菜鸟“ED”看到这些吐槽就出来喷了,说这些行家不懂神马业务安全性的重要,这帮作互联网的弱爆了,票务是必须使用 Oracle才能搞定云云。

好像还有人专门去喷了Fenng,这实在是太讽刺了。Fenng其实是Orcale ACE Director http://www.hudong.com/wiki/%E5%86%AF%E5%A4%A7%E8%BE%89,国内屈指可数的Oracle专家。

不少人,特别是弱“ED”、“专家教授”,沉寂在本身所在的领域,而后就觉得“悟”了;实际上,仅是把本身变成了井底之蛙。

知识的广博、全面性很是重要。

在某个领域,通用的东西成熟以后,每每就会有专用的解决方案出现。而专用的解决方案多了以后,又会有新的通用解决方案出现。

天下大势,分久必合,合久必分。

计算机,最先有不少专用系统,如王安打字机;我的电脑通用以后,这些专用设备就湮灭了;而iPad、手机的涌现,则又是专用系统。

是的,传统上须要去购买 Orcale、DB2 等巨贵无比的数据库系统,去知足业务需求;不是由于它们把问题解决到了极致,而是由于没有别的选择。时代已经变了,井底之蛙若把Oracle当成是王道,那只能被时代淘汰。

关系型数据库做为通用解决方案,是很是很是好的;它是一把神刀。

可是,它有如下问题:

===== ED老是要写烂SQL ====

首先. 仍是那句话,有的人纵然神刀在手,亦没法成为刀中之神。关系型数据库提供的SQL能力,是高度抽象的,封装了无数层的。写SQL的人,太多太多根本不了解SQL背后所执行的事情;烂“ED”都是如此。

这甚至造就了一个职业:DBA。DBA去负责数据库微调、优化,听起来很高级,但实质上,就是给滥用SQL的“ED”擦屁股而已。

对于庞大的企业来讲,管理者是知道大部分ED都弱爆了,他不指望也不须要ED去了解数据库,他只须要ED去完成最基本的业务功能,而后让DBA去给ED擦屁股。

大部分的ED,并无意识到这一点;他们拼命去追求方便快捷的“搞定”;滥用SQL的各类高级功能;甚至,他们把分享SQL的复杂使用当成是乐事。

ED所努力的,是把本身变笨,把活尽量的都交给神奇的数据库去解决;数据库怎么解决的,他们不关心;这实质上,是在削弱本身工做的技术含量,自我贬值而已。

工程师若是可以把数据库给用好了,哪里还有DBA什么事?

DBA所谓的数据库优化,每每就是把工程师不负责任写下的2B SQL查询找出来,而后改写为文艺方式罢了。

不要滥用数据库,一点都不难。

===== 通用数据库性能有极限 =====

其次,关系型数据库做为通用解决方案,它提供了太多的东西,它作了太多的事,而全部的事情,都有它的代价,直接而言,就是牺牲性能了。

因此,DBA的另外一个职责,则是把数据库的各类参数调配好,让其可以发挥最高的性能。

从这个意义上去说,DBA的工做就不只仅是给ED擦屁股了。

但,这样的微调,是有极限的。DBA拚了命去把鸡蛋竖立起来,考虑了桌面摩擦、空气流动、手指颤抖等等因素,鸡蛋虽然能够竖立一会,但终究仍是会倒下去;这也就是微调的极限。

在某些场景下,是能够用手的:把业务中没有用到的数据库功能都去掉;甚至,去掉完整的ACID支持。

这样一来,数据库的性能就能够有数量级的改善了。

===== 关键在于灵活性 ====

最后,上面两点,其实都是跟性能相关的;关系型数据库即使做为通用方案,它的性能有极限,但也可以知足绝大多数应用场景了。关系型数据库的软肋,是在灵活性上。

数据库有表、而表有结构;而表的结构,在应用上线以后,很难修改。

这一样造就了一些专业学问:严密的业务分析、设计数据库结构、如何在数据库上线以后修改结构等等。

这些问题或者说学问之因此存在,是植根于关系型数据库表结构不灵活的前提之上。

再次”Think out of the box“,若是数据库能够作到灵活、随时修改的表结构呢?

====== NoSQL ======

关系型数据库的三个问题,被NoSQL所有解决了。

(一样的,全部事情都有它的代价;NoSQL在解决SQL固有问题的同时,也引入了新的问题;另外一方面,NoSQL解决的也不只仅是SQL的这三个问题。)

ED要写烂SQL?没有关系,完全不让他们写SQL好了。

数据库支持功能太多?砍功能还不容易么?

Schema不灵活?那就schema-less好了。

目前,NoSQL的实现方案不少,MongoDB、Redis、Carssendra等等等等;每个均可以很是不一样,是专用解决方案:有本身独有的特性,去解决特定场景的特定问题。

(固然,像MongoDB,已经颇有NoSQL通用解决方案的意味了。)

普通程序员用SQL,文艺程序员用NoSQL,2B程序员把NoSQL当SQL用。

普通程序员在从SQL切换去NoSQL时,会受固有的SQL知识限制,总有把NoSQL当成SQL去用的冲动,但这是很是2B的行为。

从微观的角度讲,原来SQL查询中所支持的各类神奇joining / groupby都不见了;拼命的想要去找在NoSQL数据库环境下一样的神奇工具。

这完全违背了使用NoSQL的初衷:为了就是不让你滥用SQL的这些神奇功能。

滥用SQL会形成严重的性能问题,而在性能问题浮现以后,须要耗费更大的力气去纠正。

是的,信用卡透支购物很方便;但付帐单的时候就×××了;因此,换成没法透支的借记卡。

当然没有了透支的便利,会有不方便,但完全杜绝了还不起帐单,被收取高额利息的问题。

要透支的便利?ED,请先去掌握好理财技能,完全了解透支的影响,而后咱们再来谈便利。

从宏观的角度讲,会有人企图去给NoSQL作封装,让NoSQL表现得跟SQL同样;甚至,去把NoSQL去掉的那些SQL功能加回去。

SQL已是一个很是很是成熟的方案,它所可以解决的问题范畴里面,几乎没有办法作得比SQL更好。

在NoSQL的基础上,去试图模拟SQL,只能成为SQL的蹩脚模拟;还不如直接用回SQL。

在网路编程里面也有相似的例子,TCP跟UDP。能够把SQL当作是TCP,它是可靠、神奇的。UDP虽然不可靠,可是会比TCP更快。要作视频、语音通信,UDP是更好的选择。但要去作“不丢包、不失帧”的可靠视频通信,选择在UDP的基础上添加确认、重发机制模拟TCP,那就是2B了。不是天才,无法作得比TCP更好,直接用TCP就好。

做业:
1. NoSQL的方案,如MongoDB还解决了SQL的什么问题?

2. NoSQL的应用场景有啥米?

51CTO系列:

  1. 宅男程序员给老婆的计算机课程之0:认清本质
  2. 宅男程序员给老婆的计算机课程之1:认清实际
  3. 宅男程序员给老婆的计算机课程之2:怎么看待牛人
  4. 宅男程序员给老婆的计算机课程之3:架构比较
  5. 宅男程序员给老婆的计算机课程之4:SQL vs NoSQL
  6. 宅男程序员给老婆的计算机课程之5:设计模式
  7. 宅男程序员给老婆的计算机课程之6:模版引擎
  8. 宅男程序员给老婆的计算机课程之7:运维的重要性
  9. 宅男程序员给老婆的计算机课程之8:控制器
  10. 宅男程序员给老婆的计算机课程之9:数据模型
  11. 宅男程序员给老婆的计算机课程之10:作,就对了!
  12. 宅男程序员给老婆的计算机课程之11:域模型
相关文章
相关标签/搜索