数据结构知识框架【超详细】

时间 2020-11-16

标签 linux 算法数组缓存网络数据结构框架函数性能编码栏目 Linux 繁體版

原文原文链接

数据结构知识框架

先概览一下思惟导图linux

初识数据结构

概念

数据算法
- 描述客观事物的符号，是计算机中能够操做的对象，能被计算机识别，并输入给计算机处理的符号集合
数据元素数组
- 是组成数据的、有必定意义的基本单位，在计算机一般做为总体处理，也被称为记录
数据项缓存
- 一个数据元素能够由若干个数据项组成。数据项是数据不可分隔的最小单位

数据结构形式

数据结构网络
- 是相互之间存在一种或多种特定关系的数据元素的集合数据结构
- 分类框架
  - 逻辑结构函数
    - 集合结构
    - 线性结构
    - 树形结构
    - 图形结构
  - 物理结构性能
    - 顺序存储结构
    - 链式存储结构
具体概念编码
- 逻辑结构
  - 数据对象中数据元素之间的相互关系
- 集合结构
  - 集合中的数据元素除了同属一个集合外，它们之间没有其余关系
- 线性结构
  - 数据元素之间是一对一的关系
- 树形结构
  - 数据元素之间存在的一种一对多的层次关系
- 图形结构
  - 数据元素是多对多的关系
- 物理结构
  - 数据的逻辑结构在计算机中的存储形式
- 顺序存储结构
  - 数据元素存放在地址连续的存储单元里，其数据间的逻辑关系和物理关系是一致的
- 链式存储结构
  - 数据元素存放在任意的存储单元里，存储单元能够是连续的，也能够是不连续的

逻辑结构是面向问题的，物理结构是面向计算机的，其基本的目标就是将数据及其逻辑关系存储到计算机的内存中

程序

算法
数据结构

算法

解决特定问题求解步骤的描述，在计算机中表现为指令的有限序列，而且每条指令表示一个或多个操做
算法特性
- 输入
  - 算法有零个或多个输入
- 输出
  - 至少有一个或多个输出
- 有穷性
  - 算法在执行有限的步骤以后，自动结束而不会出现无限循环，而且一个步骤在可接受的时间内完成
- 肯定性
  - 算法的每个步骤都有肯定含义，不会出现二义性
- 可行性
  - 算法的每一步都必须是可行的，也就是说，每一步都可以经过执行有限次数完成
设计算法要求
- 正确性
- 可读性
- 健壮性
- 时间效率高
- 且空间使用率低
- 简单性

算法的复杂度

时间复杂度

空间复杂度

算法分析的分类

平均状况
- 任意输入规模的指望运行次数
最坏状况
- 任意输入规模的最大运行次数
最好状况
- 任意输入规模的最小运行次数，一般最好状况不会出现

时间复杂度--O渐进表示法

通常算法O(n)计算法
- 用常数1取代运行时间中的全部加法常数
- 在修改后的运行次数函数中，只保留最高阶项
- 若是最高阶项系数存在且不是1，则去除与这个项相乘的常数
分治算法的时间复杂度计算
- 二分搜索算法的时间复杂度是lgN
- M分搜索算法的时间复杂度为logM^N
递归算法的时间复杂度计算
- 递归总次数*每次递归次数
递归算法空间复杂度算法
- N*每次递归空间大小

递归

递归定义

若一个对象部分的包含它本身或者用它本身给本身定义，则称这个对象是递归的

递归的过程

一个过程直接或间接的调用本身

递归的思想

把问题分解成规模更小的具备与原来问题具备相同解法的小问题

递归条件

缩小问题规模，使新问题与原问题具备相同的解决方式
设置递归的出口

递归分类

数据结构递归
问题解法递归
递归调用栈
尾递归
- 递归调用返回的结果总被直接返回
- 尾递归的本质
  - 将单次计算的结果缓存起来，传递给下一次调用，至关于自动累积
时间复杂度
- 递归总次数*每次递归次数
回溯法
- 基本思想
- 迷宫算法

递归的优缺点

优势
- 递归在解决某些问题的时候使得咱们思考的方式的以简化，代码也更加简练，容易阅读
缺点
- 递归的实质就是本身调用本身，而函数的调用开销是很大的，系统要为每次函数调用分配空间存储空间，并将调用点信息压栈，而在函数的调用结束后，还要释放空间，弹栈恢复断点，若是递归方案的复杂度

栈

栈的概念

一种特殊的线性表，只容许从一端插入和删除数据

特色：后进先出

顺序栈

顺序堆栈和书序表数据成员相同，不一样之处，顺序堆栈的入栈和出栈操做只容许对当前栈顶进行

共享栈

一个数组实现两个栈
原理
- 既然是两个栈共享一段空间，向中间靠拢，数组两端表示两个栈的栈底，栈顶一直向中间靠近
应用场景
- 两个栈空间需求有相反的关系，也就是一个增加一个缩短的场景

链式栈

头插头删

栈的应用

括号匹配
逆波兰表达式
迷宫算法

队列

只容许在一端插入数据，在另外一端删除数据的特殊线性表

顺序队列

实现方式一
- 队头不动出队列时全部元素向前移动
实现方式二
- 出队列时，队头向后移动一个位置
假溢出现象
- 屡次入队列、出队列操做后出现的尚有存储空间但不能进行入队列操做的溢出
真溢出现象
- 最大存储空间已经存储满，继续进行入队列操做

循环队列

头尾相接的顺序存储队列就是循环队列
队列满队列空的判断
- 少用一个存储空间
  - 队尾指针加一等于队头指针就是队列满的判断条件
  - 判空条件是尾和头相等
- 设计一个标记flag
  - 初始flag置为0，入队列成功flag=1，出队列成功flag置为0
  - 队空条件rearfront&&flag0,
  - 堆满条件rear==front&&flag=1
- 设置一个计数器
  - 初始时count=0,入队列成功，count+1,出队列成功count-1
  - 队列空的条件count==0
  - 队列满的条件count>0&&rear==front或者count == MaxSize

链式队列

队列的链式存储结构，其实就是线性表的单链表，只不过它只能尾进，头出而已

优先级队列

带有优先级的队列
- 优先级高的先出队列，优先级相同的遵照先进先出规则

队列的应用

生产者消费者模型
消息队列
排队现象
网络数据传输

矩阵

特殊矩阵

有不少值相同的元素或有许多零元素，且值相同的元素或零元素的分布有必定规律的矩阵

对称矩阵

一个N*N矩阵，任意Aij = Aji
对称矩阵压缩存储
- 因为对称矩阵上三角和下三角是相同的因此只需存一半便可
对称矩阵和对称压缩存储的关系
- 下三角
  - i>jSymmetricMatrix[i][j] == Array[i*(i+1)/2+j]

稀疏矩阵

M*N矩阵，矩阵有效值的个数远小于无效值的个数，分布没有规律
稀疏矩阵压缩存储
- 只存储少许的有效值
  - 使用{row,col,value}三元组按照数组中的位置，以行优先级前后顺序一次存放

矩阵逆置

行列互换
快速逆置

初识树

树的基本概念

由N个节点（N>=0）构成的集合
- 有一个特殊的节点，称为根节点，根节点没有前驱节点
- 除过根节点外，其他节点别分红M个（M>0）个互不相交的集合T一、T2...Tn,其中每个集合又是一棵与树结构相似的子树
- 树是递归定义的

名词解释

结点
- 结点包括一个数据元素及若干指向其余子树的分支（指针（索引））
结点的度
- 结点所拥有的的子树的个数
度为0的结点
- 又称终端节点
分支结点
- 度不为零的结点
  - 非终端结点
祖先结点
- 从根结点到该结点所经分支上的全部结点
子孙结点
- 以某结点为根结点的子树中的全部结点
双亲结点
- 树中某结点有孩子节点，该结点称为它孩子节点的双亲结点
孩子结点
- 树中一个结点的子树的根结点称为该结点的孩子结点
兄弟结点
- 具备相同双亲结点的结点
树的度
- 树中全部结点的度的最大值
结点的层次
- 从根结点到树中某结点所经路径上的分支数
树的深度
- 树中全部结点的层次的最大值
有序树
- 树中结点的各棵子树T0,T1...是有序的
无序树
- 树中结点的各棵子树之间的次序不重要，能够相互交换位置
森林
- 树m棵树的集合

树的表示方法

目录结构
集合文氏图

树的存储结构

双亲表示法
- 用指针表示出每一个结点的双亲结点
  - 优势
    - 寻找一个结点的双亲结点操做实现很方便
  - 缺点
    - 寻找一个结点的孩子结点很不方便
孩子表示法
- 用指针指出每一个结点的孩子结点
  - 优势
    - 寻找一个结点的孩子结点比较方便
  - 缺点
    - 寻找一个结点的双亲结点很不方便
双亲孩子表示法
- 用指针既表示出每一个结点的双亲结点，也表示出每一个结点的孩子结点
孩子兄弟表示法
- 表示出第一个结点的第一个孩子结点，也表示出每一个结点的下一个兄弟结点

树的应用

树之二叉树

概念

一棵二叉树是结点的一个有限集合，该集合或者为空，或者是由一个根节点加上两棵分别称为左子树和右子树的二叉树组成

特色

每一个结点最多有两棵子树
二叉树的子树有左右之分，其次序不能颠倒

满二叉树

全部分支结点都存在左子树和右子树，而且全部叶子结点都在同一层上

彻底二叉树

若是一棵具备N个结点的二叉树的结构与满二叉树的前N个节点的结构相同，称为彻底二叉树

二叉树的性质、

若规定根节点的层次为1，则一棵非空二叉树第i层上最多有2^（i-1）（i>=1）个结点
若规定只有根节点的二叉树的深度为1，则深度为K的二叉树的最大结点数是2^k-1 (k>=0)
对任何一棵二叉树，若是其叶结点个数为n0，度为2的非叶结点个数为n2,则有n0 = n2+1
具备n个结点的彻底二叉树，若是按照从上至下从左到右的顺序对全部结点从0开始编号，则对于序号为i的结点有：
- 若是i>0,则序号为i的结点的双亲结点的序号为（i-1）/2,若是i==0，则序号为i的结点为根节点，无双亲结点
- 若是2i+1<n,则序号为i的双亲结点的左孩子序号是（i-1）/2，若是(2i+1)>=n,则序号为i结点无右孩子结点
- 若是2i+2<n,则序号为i结点的右孩子结点的序号为2i+2,若是2i+2>=n,则序号为i结点无右孩子结点

二叉树的存储结构

顺序存储
- 优势、
  - 存储彻底二叉树，简单省空间
- 缺点
  - 对通常二叉树尤为单支树，存储空间利用不理想
链式存储
- 子主题 1
仿真指针（静态链表）

二叉树的基本操做

二叉树的建立
二叉树的遍历
- 前序
- 中序
- 后序
- 层序
  - 初始化一个队列
  - 把根节点的指针入队列
  - 当队列非空时循环执行
    - 出队列取一个节点
    - 若该结点的左子树非空，将该节点的左子树指针入队列
    - 若该节点的右子树非空将该节点的右子树入队列
  - 结束

线索化二叉树

线索化概念

按照二叉树的遍历将二叉树导成一个线性序列

普通二叉树可能存在的问题

递归遍历有可能致使栈溢出
非递归版本可能会下降程序的效率
想要找到某种遍历形式下某个节点的前驱仍是后继比较难
树中有大量的空指针域形成浪费，

线索化过程

当某结点的左指为空时，令该指针指向按照某种方式遍历二叉树时获得该结点的前驱节点
当某结点的右指针为空时，令该指针指向按照某种遍历方式遍历二叉树时获得该结点的后继结点

线索标志位

做用区分是孩子结点仍是前驱或者后继
leftThread
- 0
  - leftChild
- 1
  - leftThread
rightThread
- 0
  - rightChild
- 1
  - rightThread

线索

结点中指向前驱或者后继结点的指针

线索二叉树

二叉树的结点加上线索的二叉树

对二叉树按照某种方式（前序、中序、后序）遍历使其称为线索二叉树的过程称为按照什么方法对二叉树进行线索化

堆

堆的概念

把全部的元素按照彻底二叉树的方式存储在一个一维数组中并知足Ki<=K2i+1且Ki<=K2i+2（Ki>=K2i+1且Ki>=K2i+2）,这个堆称为最小堆（最大堆）

堆的分类

小堆
- 任一节点的关键码均小于它左右孩子的关键码，位于堆顶结点的关键码最小
大堆
- 任一结点的关键码均大于它左右孩子的关键码，位于堆顶结点的关键码最大

堆的性质

若是i=0，结点i是根结点，没有双亲结点，不然结点i的双亲结点为（i-1）/2
若是2i+1>n-1,则结点i无左孩子，不然结点i的左孩子为节点2i+1
若是2i+1>n-1,则结点i无左孩子，不然结点i的左孩子为节点2i+2

堆的建立

从上向下调整

堆的插入

堆的删除

堆的应用

优先级队列

Huffman树

概念

路径
路径长度
把带权路径长度最小的树叫作Huffman树

构造huffman树

构造n棵只有根结点的二叉树森林，每棵二叉树都只有一个带有权值的根结点
重复如下步骤，直到F中只剩下一棵树
- 在二叉树森林中选最小的两个，做为左右子树构建一棵新的二叉树，新二叉树的根结点的权值为左右子树根结点的权值之和
- 在原来二叉树森林里删除这两棵二叉树
- 把新的二叉树加入二叉树森林

huffman编码

编码
- 在数据通讯中常常把传输的文字转换成二进制字符0和1组成的二进制串，这叫作编码
- 等长编码
- 不等长编码

文件压缩

二叉搜索树

性质

若是左子树不为空，则左子树上全部节点的值都小于根结点的值
它的右子树不为空，则右子树上全部节点的值都大于根结点的值
它的左右子树也分别为二叉搜索树

操做

搜索
- 若根结点不为空
  - 根结点key==要查找的key，返回true
  - 根结点key>查找key，在其左子树查找
  - 根结点key<查找key，在其右子树查找
  - 不然返回false
插入
- 首先检测这个节点是否是已经存在，要是存在不插入
- 不然将元素插入到找到的位置
删除
- 首先判断是否在树中，没有直接返回
- 有的状况
  - 要删除的节点没有孩子节点
    - 直接删除该结点
  - 要删除的节点只有左孩子
    - 删除该结点并使被删除结点的双亲结点指向被删除结点的左孩子结点
  - 要删除的节点只有右孩子
    - 删除该结点并使被删除结点的双亲结点指向被删除结点的右孩子结点
  - 要删除的节点有左、右孩子结点
    - 在它的右子树中寻找中序下的第一个结点（关键码最小），用它的值填补到被删除节点中，再来处理该结点的删除问题
二叉搜索树性能分析
- 最坏状况下，平均查找长度为O(n)通常状况下平均长度为O(lgn)

AVL树

AVL树性质

它的左右子树都是AVL树
左子树和右子树高度之差（简称平衡因子）的绝对值不超过1（-一、0、1）
若是一棵树是高度平衡的，它就是AVL树。若是它有n个节点，其高度可保持在0(lgn)，平均搜索复杂度O(lgn)

平衡化旋转

左单旋
右单旋
左右双旋
右左双旋

AVL树的插入

若是是空树，插入后即为根结点，插入后直接返回true
若是树不空，寻找插入位置，若在查找过程当中找到key，则插入失败直接返回false
插入节点
更新平衡因子，对树进行调整

AVL树的删除

被删除结点只有左孩子
- parent的平衡因子为1或者-1，parent高度不变，则从parent到根全部结点高度均不变，不用调整
被删除结点只有右孩子
- parent的平衡因子变成0，虽然以parent为根的子树平衡，其高度减1，但须要检查parent的双亲结点的平衡性
被删除结点左右孩子都有
- 变为删除中序遍历下的第一个结点q
  - 结点parent的平衡因子为2或者-2，则较矮子数缩短，parent发生不平衡，须要进行平衡化旋转
parent较高子树的根为q
- 若是q的平衡因子为0，执行单循环恢复parent
- 若是q的平衡因子与parent平衡因子（正负）号相同，则执行一个单循环恢复parent
- 若是q的平衡因子与parent平衡因子（正负）号相反，则执行一个双旋转恢复parent

红黑树

概念

红黑树是一棵二叉搜索树，它在每一个节点上增长了一个存储位来表示结点的颜色，保证最长路径不超过最短路径的两倍，近似平衡

性质

每一个结点不是红色就是黑色
树的根结点是黑色
若是一个结点是红色的，则它的两个孩子结点是黑色的（没有连续的两个红色结点）
对于每一个节点，从该结点到其全部后代叶节点的简单路径上，均包含相同数目的黑色结点（每条路径上黑色结点的数量相等）
每一个叶子节点都是黑色的（此处的叶子结点指的是空节点）

插入实现

若树为空，插入后需将新节点改为黑色
插入结点的父节点为黑色，不违反任何性质，直接插入
状况三
状况四
状况五

删除

运用

C++STL库--map/set multimap multiset
Java库
linux 内核
其余一些库

红黑树和AVL树的比较

B树

平衡的多叉树

性质

根结点至少有两个孩子
每一个非根结点至少有M/2（上取整）个孩子，至多有M个孩子
每一个非根结点至少有M/2-1（上取整）个关键字，而且以升序排列
key[i]和key[i+1]之间的孩子结点的值介于key[i]、key[i+1]之间
全部的叶子结点都在同一层

B+树

性质
- 其定义基本与B树相同
- 非叶子节点的子树指针与关键字个数相同
- 非叶子结点的子树指针P[i]，指向关键字值属于[k[i],k[i+1])的子树
- 为全部叶子节点增长一个链指针
- 全部关键字都在叶子节点出现
搜索
- 和B树基本相同
特性
- 全部关键字都出如今叶子节点的链表中（稠密索引），且链表中的关键字刚好是有序的
- 不可能在叶子结点命中
- 非叶子节点至关因而叶子结点的索引（稀疏索引），叶子结点至关因而存储（关键字）数据的数据层
- 更适合文件索引系统

B*树

在B+树的非根和非叶子结点之间再增长指向兄弟的指针
子主题 2

哈希

搜索（检索）

在数据元素集合中查找是否存在关键字等于某个给定关键字数据元素的过程
结果
- 成功
- 失败
搜索结构
- 用于搜索的数据集合
搜索的环境
- 静态环境
  - 在执行插入和删除等操做的先后搜索结构不会发生改变
- 动态环境
  - 为保持较高的搜索效率，搜索结构在执行插入和删除等操做的先后将自动调整，结构可能会发生改变

查找

静态查找
- 顺序表
  - 从前日后依次遍历O（n）
- 有序顺序表
  - 二分查找O（log(n)）
- 索引顺序表
动态查找
- 二叉树结构
  - 二叉排序树
  - 平衡二叉树
- 树结构
  - B树
  - B+树
哈希查找
- 每一个元素的关键码和结构中一个惟一的结存储位置相对应
- 散列方法
  - 插入和查找数据利用哈希函数求出存储位置再存放或者查找
哈希冲突
- 对于两个数据Ki和Kj（i!=j）,Ki!=Kj,可是有Hash(Ki)==Hash(Kj)
散列函数
- 哈希函数的定义域必须包括须要存储的所有关键码，而若是散列表容许有m个地址时，其值域必须在0-m-1之间
- 哈希函数计算出来的地址能均匀的分布在整个空间中
- 哈希函数应该比较简单
常见哈希函数
- 直接定址法
  - 取关键字的某个线性函数为散列地址
    - 优势：简单均匀
    - 缺点：须要事先直到关键字的分布状况
  - 使用场景：适合查找比较小且连续的状况
- 除留余数法
  - 设散列中容许的地址数为m，取一个不大于m，但最接近或者等于m的质数p做为除数，按照哈希函数：Hash(key)=key%p,p<=m;将关键码转换成哈希地址
- 平方取中法
  - 假设关键字是1234，平方就是1522756，再抽取中间的三位数227做为散列地址
- 折叠法
  - 将关键字从左到右分红位数相等的几部分，而后将这几部分叠加求和，并按散列表长，取后几位做为散列地址
- 随机数法
  - 选择一个随机函数，取关键字的随机函数值为它的哈希地址
- 数学分析法
  - 设有n个d位数，每一位肯能有r种不一样的符号，这r种不一样的符号在各位上出现的频率不必定相同，可能在某些位上分布比较均匀，可将分布均匀的几位根据开散列的方式做为散列地址

散列冲突处理方法

闭散列法
- 一旦发生冲突，就去寻找下一个空的散列表地址，只要散列表足够大，空的散列地址总能知道
  - 线性探查
    - 插入时发现该位置的数据和要插入数据相等，不插入
    - 产生冲突，依次查看其后的下一个桶，若是有空位置插入数据
  - 二次探查
    - 使用二次探查法，在表中寻找下一个空位置的公式是H(i)=(H0+i^2)%m,H(i)=(H0-i^2)%m
    - 当表的长度为质数且转载因子不超过0.5时，新的表项必定能插入
  - 双散列法
    - 须要两个散列函数，当一个发生冲突时，利用下一个散列函数计算偏移量
- 载荷因子
  - a=填入表中的元素个数/散列表的长度
    - 控制在0.7-0.8如下，超过0.8，查表时CPU缓存指数上升
开散列法
- 首先对关键码集合用散列函数计算散列地址，具备相同地址的关键码归于同一子集合，每一个子集合称为一个桶，各个桶中的元素经过一个单链表连接起来，各链表的头结点组成一个向量，向量的元素个数与可能的桶数相同

布隆过滤器

当一个元素被加入集合时，经过k个散列函数将这个元素映射成一个位数组中的k个点，将它们置为1，检索时只要看是否是都是1，就能够，只要有一个零就不是，全是1，多是

排序

概念

就是将一组杂乱无章的数据按照必定的规律（升序或降序）组织起来
数据表
- 待排序数据元素的有限集合
排序码
- 一般数据元素有多个属性域，其中有一个数据域可用来区分元素，做为排序依据，该域即为排序码
- 若是在数据表中各个元素的排序码互不相同，这种排序码称为主排序码

排序算法的稳定性

两个元素R[i]R[j],它们排序码K[i]==K[j]，且在排序以前，元素R[i]在R[j]以前，元素在R[i]和R[j]的顺序不变

常见排序算法

插入排序
- 直接插入排序
  - 插入到已排序序列中，先找位置，而后将位置以后得元素后移
  - 稳定
- 希尔排序
  - 缩小增量排序
选择排序
- 选择排序
  - 每次把最小的元素换在最前面
  - 锦标赛排序
    - 一直两两比较找出获胜者，将这个再也不比较，其余继续两两比较，取得获胜者，一直循环
  - 不稳定
- 堆排序
  - 升序建立大堆，不然建立小堆
  - 不稳定
交换排序
- 冒泡排序
  - 稳定
  - 依次比较相邻两个元素，不知足条件交换
- 快速排序
  - 取一个基准值将比它小得放在左侧，大的放在右侧。左右两部分递归取基准值继续分
归并排序
- 归并排序
  - 将待排序的序列分红两个等长的子序列，而后将它们合并成一个序列
非比较排序
- 计数排序
- 基数排序

图

由顶点集合及顶点间关系组成的一种数据结构

顶点和边

顶点
- 图中结点称为结点
边
- 顶点与顶点之间有一条边

图的分类

有向图
- 在有向图中，顶点对<x,y>是有序的<x,y><y,x>是不一样的两条边
无向图
- (x,y)(y,x)是一条边

彻底图

在有n个顶点的无向图中，如有n*(n-1)/2条边，即任意两个两个顶点之间有且只有一条边
在n个顶点的有向图中，如有n*(n-1)条边，即任意两个顶点之间有且仅有方向相反的边

邻接结点

在无向图中G中，若（u,v）是E（G）中的一条边，则称u和v互为邻接顶点，并称（u，v）依附于顶点u和v
在有向图G中，若<u,v>是E（G）中的一条边，则称顶点u邻接到v，顶点v邻接自顶点u，并称边<u,v>与顶点u和v相关联

顶点的度

与它相关联的边的条数
- 在有向图中，顶点的度等于该顶点的入度与出度之和，其中顶点v的入度是以v为终点的有向边的条数，记作indev(v)顶点v的出度是以v为起始点的有向边的条数记作outdev（v）
- 无向图的度等于入度和出度 dev(v) = indev(v) = outdev(v)

路径

在图G=(V,E)中，若从顶点vi出发有一组边使其可到达顶点vj，则称顶点vi到vj的顶点序列为从顶点vi到顶点vj的路径

权

边附带的数据信息

路径长度

对于不带权的图，一条边的路径长度是指该路径上的边的条数
对于带权的图，一条路径的长度是指一条路径的路径长度是指该路径上各个边权值的总和

简单路径与回路

如路径上各个顶点均不重复，则称这样的路径是简单路径，若路径上第一个顶点v1和最后一个顶点vm重合，则称这样的路径为回路或环

子图

设图G={V,E}和图G1={V1.E1},若V1属于V且E1属于E，则称G1是G的子图

连通图

无向图中，两个顶点之间有路径就是连通的，任一对顶点之间都是连通的则称这个图是连通图

强连通图

在有向图中，任意一对顶点vi和vj之间都存在一条从vi到vj的路径，也存在一条从vj到vi的一条路径

生成树

一个连通图的最小连通子图称做该图的生成树，有n个顶点的连通图的生成树有n个顶点和n-1条边

图的存储结构

邻接矩阵
邻接表
- 无向图
- 有向图

图的遍历

深度优先
广度优先

连通份量

当无向图为非连通图时，从图中某一顶点出发，利用深度优先搜索或广度优先搜索算法没法遍历图的全部顶点，而只能访问到该节点所在的最大连通子图的全部顶点，这些顶点构成一个连通份量

最小生成树

准则
- 只能使用图中的边来构造最小生成树
- 只能使用刚好n-1条边来链接图中的n个顶点
- 选用的n-1条边不能构成回路

贪心算法

在问题求解时，老是作出当前看起来最好的选择，也就是局部最优解

Kruskal算法

每次找一条具备最短权值且再也不同一连通份量上的边加入生成树

prime算法

挨着找

单元最短路径

从在带权图的某一顶点出发，找出一条通往另外一个顶点的最短路径，最短也便是沿路径各边的权值和最小