而从目前实际的发展来看,基本上目前发展的核心思路并无绕开人们在数据库理论领域内所积累的那些关键的特性。所以,若是你但愿可以快速的在海量数据的在线处理领域内积累知识,从传统数据库领域入手是绝对不会错的。java
下面,就让咱们对数据库作个简单的解刨,看看数据库里面有哪些核心的组件吧。程序员
映射(Map):
首先就须要有可以存储数据并提供查询的结构,这个结构,在java里面就是Map。C里面也是Map.他的核心做用就是,创建一种key与value的映射关系,当给定某个key的时候,他可以返回这个key所对应的value给用户。这是用户在进行查询时的主要数据结构。算法
预写式日志(write-aheadlogging,WAL):
就是个队列,记录了你每一次写的操做。天然而然的,由于你的每次写操做都被记录下来了,因此就算计算机断电了,只要这个日志没有损坏,计算机重启后按照这个log,重放在断电时的那些写操做,就能够保证你的数据不丢。
这里,必定会有人问:既然我数据都存储在k-v表里了,明显就不会丢失了。为何还要有这个log呢?这其实就是一个计算机的本质性问题了,别看现代计算机运算速度这么快,他终归也只是个“图灵机”实现,或者更具象化一点,就是一台打字机,一次只能打一个字母,那么可能会有人问了,若是我要用几个字母来表示同一个意思,应该怎么作呢?在英语中,最简单的方式就是在词组和词组之间增长空格。好比writeaheadlogging.就是三个由字母组成的单词。在计算机里,也有相似的问题,用户的一次写入操做,可能对应计算机内的多步操做,如何可以保证这屡次的操做要么所有成功,要么所有失败呢?WAL就是个解决的方法,他利用的是操做系统里的一个原子操做fsync().该操做的做用是将一小段数据写入到磁盘,从而保证数据不会丢失。
咱们来看一下总体的操做思路:记录用户的写入操做(insert,update,delete)->进行内部屡次key-value映射的构建,包括主数据,辅助索引数据等->标记该用户操做完成。sql
触发器(trigger)
一个不难理解的概念,当发生insert,update,delete等操做的时候,可能会有一些需求须要依托这些操做而被触发执行其余的操做。好比每一行针对表A的更新,都会引起B表内的更新。那么这个“引起”的过程,就是触发器。在一些其余的语言里面,这也被叫作callback,IFTTT,Listener等。但核心概念都同样,被动的由于某个事件而触发一段代码逻辑的运行。
在一些数据库的实现中,甚至二级索引的更新也是使用触发器来完成的哦:)
在数据库内,触发器所有是同步实现的,也就是说,只有当数据写入的操做,以及触发器的操做所有都执行完成后,才会返回用户执行成功。数据库
锁(lock)
锁的主要目标是容许线程圈定一批资源,并规定该资源只容许发出圈定请求的那个线程进行访问,而其余线程则必须等待。
这个概念产生的主要缘由其实仍是与计算机是图灵机有关。。原本计算机就是台图灵机,一个时钟周期内只能打一个字母,但这样他就很难同时作好几件事情,好比听着歌写代码,这件事其实从计算机硬件来讲是作不到的,他只能模拟,利用时分复用的方式,把cpu的运算分解成小片,每一个线程都只占用一小段时间,从而可以作到同一时间作好几件事。可是,想想,若是咱们但愿一我的A用打字机打iamgod.而但愿另一我的B用同一台打字机打pigismoney.开始,时间片分配给A,他打印了iam后,A被cpu换出,B被换入,打印了pig后被其余人换出,那么咱们天然就发现。。数据就变成了。。。那么锁的做用就是保证一个逻辑的原子操做没有完结的时候,这张打印纸只属于A,其余人不能对其进行访问或进行修改。
明白了原理,来简单看看实现,锁主要是由排他锁(写锁)和共享锁(读锁)构成,在数据库的锁实现中,有不少针对共享锁和排他锁相互组合的细节性描述,但其核心的问题却永远没变:
1)尽量的减小同一时间内被阻塞的线程数,从而提高并行度。
2)尽量的避免死锁
能够说数据库实现的是好是坏,关键就看着锁的优化好很差,这在分布式场景或者在单机内都是最重要的一个机制。编程
执行优化器
这是关系数据库得名的缘由,主要的做用是将关系查询转换成key-value查询,输入是sql的抽象语法树(ast),输出则是执行计划,就是各位在数据库命令行打explainsql时候出来的那些东西。
理解上很简单,但实际上实现起来倒是最为复杂的,在上个世纪,大部分的执行优化器使用rulebasedoptimizer,也就是基于规则的优化,但在现代数据库实现中,大部分的优化器都采起了costbasedoptimizer了,他们之间最大的不一样,就是cbo更多的考虑了数据实际的区分度状况,从而能更简单准确的从。多个可选的索引中选择一个正确的索引。缓存
sql解析器
做用很简单,把用户输入的sql转化为计算机能够理解的抽象语法树(不懂就去看编译原理:)安全
好了,基本组件儿介绍完毕,下面咱们利用这些核心组件来尝试拼装一些外围的概念。服务器