数据结构的知识点全貌

数据结构是算法的基石,算法是软件灵魂。算法

数据结构的不少概念真的是很莫名其妙,不少坑爹的定义,笔者开始很搞不明白,为何学数据结构?为何用哪一个拗口词语?这些概念到底用在什么地方?笔者试图用本身简单的话来阐述这些问题,但愿能对这些感受不是很好理解的同窗有帮助。数据库

不废话,直接开始。数组

1、概论

  • 时间复杂度:就是算法实现的执行的时间,说白了就是程序套了好多循环。没有就是o(n),2层循环就是o(n2),如此,剩下就不要管了。
  • 空间复杂度:说白了就是你定义了好多的变量,程序执行是额外使用了好多冗余内存。
  • 算法标准:什么算法是好的算法?好用就行。一、正确二、简单 三、占内存少 四、速度快 ,这几点不可兼得,本身把握,其实能简单和速度是主要的。

2、线性表

顺序存储结构:连续的存储。网络

链式存储结构:内存中随机存储的,只须要指针写出下一个结点在哪里便可。数据结构

  • 线性表:逻辑上不分叉就行。一个个数据元素先后相连(就是前驱、后继)。数据项平等对待。与此相对就是数、图。用途:其实就是数组啦。
  • 链表:采用链式存储方式的线性表。什么是链式存储?就是一个数据项中不只保存数据还要告诉下一个数据在哪里。用途:数据大小不肯定时用。

从普通链表拓展的概念:并发

  1. 循环链表:首尾相连的链表;
  2. 双链表:先后相随的链表;前<  >后

用途:特殊状况加快链表的操做;编码

3、栈和队列

这个什么东西?就是功能被限制的链表,没有什么区别;spa

栈:只能从上面往下放,而后从上面去取;  就是一个坑啊,有木有!.net

  • 链栈:链式存储的栈;
  • 顺序栈:顺序存储的栈;

队列:前面装入数据,后面取出数据; 用途:保障时间的顺序,好比用户事务操做;指针

  • 链队列:链式存储的队列;  链队列:长度没限制啊,是否是、
  • 顺序队列:顺序存储的队列; 

4、串

就是把字符放到前面的线性表中。否则怎么叫字符串呢? 因此不少语言字符串就是一个对象;

5、多维素组

素组的元素能够又是一个数组。 这个就是一个树。

6、树

有分叉的链表可是不能首尾相连;(线索二叉树除外,线索二叉树就是图了都);

  • 二叉树:最多两个分支。
  • 深林:几个树放到一块儿(没链接哈),就是个深林;形象啊、
  • 遍历:记住以根为标准便可,先访问根:先序;访问了左边,再访问根:中序;最后访问根:后序;
  • 最优二叉树(哈夫曼树):就是把权重的往上放。   用途:用来编码,用的多的,权重的天然放在前面了,权力大的就在上面(和金字塔的社会不是很像么?);
  • 线索二叉树:叶子节点的指针域不要浪费,指向其余,按照遍历的顺序来。其实就是一个图了。

7、图

无限个指针域,随你指向那个结点,不要重复就行。

  • 无向图:指向a 被指向a,算做同样;
  • 有向图:指向a被指向a,不一样的,不同;
  • 带权:指向这个行为还有程度值,权值。
  • 网络:带权的有向图。 路由协议中,由路由器组成的网络就是向且带权,好比速度、延迟不同,上传、下载速度不同;

遍历的问题有点麻烦

  • 深度优先:就是一直往下走,不回头。
  • 广度优先:一层一层剥下去。
  • 生成树:把图滤成一个树。删除循环的链接;primus算法相似深度优先的思想,克鲁斯卡尔算法相似广度优先的思想;
  • 最短路径:一个一个列出来,比较最小的;

8、排序和查找

先看排序:

  1. 冒泡排序:就像气泡同样,当前元素和下一个比,合适就这样,不合适就交换折腾 n * n次
  2. 快速:元素找到本身的排序位置,当每一个人都找到了,那个顺序就定了。
  3. 选择:老实的排序法,找到最值,放在哪里,又去找最值。。。。
  4. 堆:和选择同样建一个具备堆的性质二叉树(节点永远比子节点大),堆顶就是最值,拿出来,再建一次堆。。。
  5. 插入:随便拿一个向有序的中放。问:开始没有有序的序列啊?答:开始只有找一个元素参照,一个必然是有序的,而后能够结合二分法查找,来排序,用查找的思想排序,逆天了有木有啊、
  6. 归并:几组有序的合并成一个。很简单,每人轮流拿出一个比较下,放进篮子里不就完了。

排序好了才能查找,不然就只能一个一个查找了

  1. 顺序查找:就是一个一个来;
  2. 二分法:简单,找中间,每次排除一半;
  3. 分块:建个索引,就是分割区域,这些区域对应到一个序列,例如123,而后去找,索引越细致,速度越快,可是修改了,会重建索引,把握程度便可。
  4. 二叉排序树:把数据存在一个树里,这个树的数据以中序遍历的顺序来存,这个结点的左边比右边小,就很好找了、每次排除总体的一半。
  5. B-树:用二叉排序树当作索引存普通数据,由于二叉排序树的创建、删除代价太大了。

什么是散列?

举个栗子。。。。数据位1-100,怎么存?你能够用1-5(本身定哈),1-20划到1中,21-40划到2中。那么就是1-100的散列为1-5,查找就很方便了,先看在那个区域里,再去找。能够说这是二分法的推广,二分法其实就是看作1-2的散列。

最后说几个问题:

  1. 排序用在数据库中的表记录上面,数据库必需要排序,就是在创建索引时发生的。大量的数据才会体现,排序算法的价值,能够用来节约钱啊。
  2. 数据库通常把索引文件和数据文件分开的。特别典型的就是MYSQL的MYISAM存储引擎。
  3. 所谓的存储引擎就是不经过的算法实现,采用不一样的适合不一样场合的算法,这些场合要求不一样,好比有的要求速度,有的要求并发量大,可串行化。数据库采用具不一样的存储引擎,对程序有很大的影响,且必定要合适。