图之总结

程序员文章站 2022-05-21 16:13:55

...

什么是图？图的存储方式？
　　前面总结了“树”这种数据结构，而这篇博客总结的是更为复杂的一种数据结构：图（graph），它表明了物件与物件之间的“多对多”的一种复杂关系。图包含了两个基本元素：顶点（vertex, 简称V）和边（edge,简称E）。

有向图与无向图

如果给图的每条边规定一个方向，那么得到的图称为有向图。在有向图中，从一个顶点出发的边数称为该点的出度，而指向一个顶点的边数称为该点的入度。相反，边没有方向的图称为无向图。

有权图与无权图

如果图中的边有各自的权重，得到的图是有权图。比如地铁路线图，连接两站的边的权重可以是距离，也可以是价格，或者其他。反之，如果图的边没有权重，或者权重都一样（即没有区分），称为无权图。

连通图

如果图中任意两点都是连通的，那么图被称作连通图。图的连通性是图的基本性质。无向图中的一个极大连通子图称为其的一个连通分量。有向图中，如果对任意两个顶点 [公式] 与 [公式] 都存在 [公式] 到 [公式] 以及 [公式] 到 [公式] 的路径，则称其为强连通图，对应有强连通分量的概念。

图的存储

常用的存储方式有两种：邻接矩阵和邻接表。

邻接矩阵

采用一个大小为 [公式] 的矩阵 [公式] ，对于有权图， [公式] 可以表示[公式] 到 [公式]的边的权重，如果是无权图，则可设为1表示存在边，0表示不存在边。因此邻接矩阵的表示相当的直观，而且对于查找某一条边是否存在、权重多少非常快。但其比较浪费空间，对稠密图（ [公式] ）来说，会比较适合。

一般情况下我用的邻接矩阵的结构和初始化代码如下，具体会根据使用需求有所改动。

struct GNode{
int Nv; // number of vertices
int Ne; // number of edges
int G[MaxVNum][MaxVNum];
};
typedef struct GNode *MGraph;
MGraph Graph = new GNode[MaxVNum];

// 初始化图
void InitGraph(int N,int E){
Graph->Nv = N;
Graph->Ne = E;
for (int u=0;u<=N;u++)
for (int v=0;v<=N;v++)
Graph->G[u][v]=INF;
}
//插入边（这里是有权重的无向边）
void InsertEdge(int u,int v,int weight){
Graph->G[u][v]= weight;
Graph->G[v][u]=weight;
}

邻接表

[公式] 为一个大小为 [公式] 的指针数组，对应每行存储一个链表，如[公式] 中存储从顶点 [公式] 出发的边，如从顶点1出发的边有 [公式] 和 [公式] 其在 [公式] 中存储的形式如下图所示。邻接表比较适合稀疏图（ [公式] ）

邻接表存储图。
　　另外，之前做习题的时候也会习惯用个二维数组来存储邻接表，比如上面的[公式] 。

一般情况下我用的代码如下，会根据具体需求有大改动。

typedef struct VNode *AdjNode;
struct VNode{
int node;
AdjNode next;
};
AdjNode Graph = new VNode[MaxV];

void InitGraph(int N,int E){
Graph->Nv = N;
Graph->Ne = E;
for (int i=1;i<=N;i++){

	(Graph+i)->node=i;
	(Graph+i)->next=NULL;
}

}
// 插入有向边
void InsertEdge(int u,int v){
AdjNode tmp1=new VNode;
AdjNode tmp2 = new VNode;
tmp1->node = v;
tmp1->next = (Graph+u)->next;
(Graph+u)->next=tmp1;
tmp2->node = u;
tmp2->next = (Graph+v)->next;
(Graph+v)->next=tmp2;
}
2. 图的遍历
　　图的遍历最常用的有两种：深度优先搜索（Depth-first Search, DFS）和广度优先搜索（Breadth-First Search, BFS）。

深度优先搜索

有点类似于树的前序遍历，即从一个选定的点出发，选定与其直接相连且未被访问过的点走过去，然后再从这个当前点，找与其直接相连且未被访问过的点访问，每次访问的点都标记为“已访问”，就这么一条道走到黑，直到没法再走为止。没法再走怎么办呢？从当前点退回其“来处”的点，看是否存在与这个点直接相连且未被访问的点。重复上述步骤，直到没有未被访问的点为止。
　　从上述文字表述可以看出，DFS很适合使用递归，其代码如下：

int visited[MaxN]={0}; //记录顶点的访问状态
int result[MaxN]; //result数组记录DFS遍历结果
int N,E,k;// N为顶点数，E为边数，k记录遍历结果下标

void DFS(int v){
visited[v]=1;
result[k++]=v;
for (int i=0;i<N;i++){
if (G[v][i]==1 && visited[i]==0)
DFS(i);
}
}

int main(){
for (int i=0;i<N;i++){
k = 0;
if (visited[i]==0){
DFS(i);
//用{}打印出一个连通分量
cout<<"{ “;
for (int j=0;j<k;j++)
cout<<result[j]<<’ ';
cout<<”}"<<endl;
}

return 0;
}

广度优先搜索

有点类似于树的层序遍历，也就是像剥洋葱一样，“一层一层地剥开♩♩♩”。即从一个选定的点出发，将与其直接相连的点都收入囊中，然后依次对这些点去收与其直接相连的点。重复到所有点都被访问然后结束。
　　类似树的层序遍历，BFS同样可以通过一个队列来实现，代码如下：

int visited[MaxN]={0}; //记录顶点的访问状态
int result[MaxN]; //result数组记录BFS遍历结果
int N,E,k;// N为顶点数，E为边数，k记录遍历结果下标

void BFS(int v){
queue q;
q.push(v);
visited[v]=1;
result[k++]=v;
while(!q.empty()){
int u = q.front();
q.pop();
for(int i=0;i<N;i++){
if (G[u][i]!=0 && visited[i]!=1){
visited[i]=1;
q.push(i);
result[k++]=i;
}
}
}
}

int main(){
for (int i=0;i<N;i++){
k = 0;
if (visited2[i]==0){
BFS(i);
//用{}打印出一个连通分量
cout<<"{ “;
for (int j=0;j<k;j++)
cout<<result[j]<<’ ';
cout<<”}"<<endl;
}
}
return 0;
}

上述BFS和DFS的时间复杂度均为 [公式] 。
3. 最短路径
　　简而言之，最短路径就是找图中连接两个顶点所有边权重和最小的路径。

对无权图而言，即是找边最小的路径；
如果给定起点，则是单源最短路径，即从一固定起点到任意终点的最短路径；
如果起点不确定，则是多源最短路径，即求任意两个顶点的最短路径。
单源最短路径

对于无向图而言，可以借助BFS的“剥洋葱”特性，看从起点到终点需要剥几个洋葱圈，剥的层数即是最短路径长度。

对于有向图而言，就不得不提到一个煊赫的名字：Dijkstra算法。陆续泛听了几个版本的数据结构，这个名字简直太深入人心。

Dijkstra算法
　　具体来说，Dijkstra算法的核心在于：从起点（或者说源点）开始，将其装进一个“袋子”里，然后不断往这个袋子里搜罗顶点，当顶点收进去后，能保证从源点到该顶点的当前最短路径是确定的。每次收录的顶点是在未收录的集合里寻找最短路径最小的点（即离源点最近的点），然后将与收进去的顶点直接相连的点的最短路径进行更新。

如下图所示， [公式] 是新鲜被收录的点， [公式] 等是和 [公式] 有直接相连的边的点，那么这些点的距离会在[公式] 收录后立马被更新。

值得注意的是：Dijkstra算法不适用于存在负权重边的图。

给出Dijkstra代码前先对保存最短路径的数组dist[]和收录状态的数组collected[]进行初始化：和源点直接相连的点的最短路径即为该边的权重，其余均初始化为一个很大的（一看就不可能的数）INF；collected中所有值初始化为false。

int dist[MaxN];
bool collected[MaxN];

void InitDist(int start){
for (int i=0;iNv;i++){
dist[i]=Graph->G[start][i];
collected[i]=false;
}
}
　　然后，我们需要寻找下一步被收录的点：即在所有未被收录的点中寻找dist最小的点。如果不存在（最小值为无穷大INF），则返回错误标识-1。这一步找最小值，我们可以每次都将所有顶点扫描一遍获得，也可以很自然地想到将dist存在一个最小堆（优先队列）里。对于前者，因为每次收录都要扫描一次所有顶点，有 [公式] 复杂度，然后每条边都会扫描一次，时间复杂度为 [公式] 。对于后者，每次收录时找到目标的时间为 [公式] ，有 [公式] 复杂度，而每次扫描边然后更新dist的时间也是 [公式] ，有 [公式]复杂度，所以总的复杂度为 [公式] 。

int findMinDist(int start){
int MinD = INF;
int MinV;
for (int end =0;endNv;end++){
if (collected[end]==false && dist[end]<MinD){
MinD=dist[end];
MinV=end;
}
}

if (MinD<INF)
	return MinV;
else
	return -1;

}
　　然后是Dijkstra算法主程序：在初始化后，先将源点收录进袋，并且源点的最短路径设为0, 然后开始循环寻找能被收录的点：如果接受到的是错误标识-1，说明找不到符合要求的点了，程序结束。如果找到了，则先将这个点收录进去，记录为s；然后遍历从s出发的所有边，对没有收录的点，更新他们的最小路径值。更新的依据是：如果这个点t的当前的最小路径值，大于s点的最小路径值与s到t边的权重值之和，则更新为 [公式] ，否则维持原状。

bool dijkstra(int start){
InitDist(start);
dist[start]=0;
collected[start]=true;
int s;
while (1){
s = findMinDist(start);
if (s==-1)
break;
collected[s]=true;
for (int t=0;tNv;t++){
// if W is not collected and s->t exists
if (collected[t]==false && Graph->G[s][t]<INF){
// check if it is a negative-weighted edge
if (Graph->G[s][t]<0) return false;
// check if dist[t] needs update
if (dist[t]>dist[s]+Graph->G[s][t])
dist[t]=dist[s]+Graph->G[s][t];
}
}
}
return true;
}
多源最短路径

按照上面已有的Djikstra算法，可以直接将Djikstra算法在每个顶点调用一遍，然后找最小值。时间复杂度为：

直接找dist最小： [公式] 。
最小堆维护dist： [公式] 。
　　另外还有一种更为直接的算法是Floyd算法，且代码看着简洁直观优美。。。

bool Floyd(){
int i, j, k;
for (k=0;kNv;k++)
for (i=0;iNv;i++)
for (j=0;jNv;j++)
if (dist[i][k]+dist[k][j]<dist[i][j]){
dist[i][j]=dist[i][k]+dist[k][j];
if (i==j && dist[i][j]<0) //发现负值回路
return false;
}
return true;
}
　　三重循环嵌套，可以直观看出时间复杂度为 [公式] 。意思也很明白，对于每对源点ｉ和终点ｊ，找一个跳板ｋ，看是否经过跳板k距离会比现有的从i到j的距离短，如果是，则更新；否则不作为。发现负值回路的话解不存在，错误返回。

参考资料：

coursera的《算法分析与设计》（以前的课程）
MOOC网的《数据结构与算法》

上一篇：对于python中循环迭代变量的再探讨

下一篇： [数据结构] DS树+图综合练习--拓扑排序

图之总结

JDK 1.8 之 Map.merge()

springboot系列之01-产生的背景及其优势

Spring5源码解析4-refresh方法之invokeBeanFactoryPostProcessors

Docker学习笔记之容器查看启动终止删除的方法

jQuery插件HighCharts绘制的2D堆柱状图效果示例【附demo源码下载】

mybatis查询语句的背后之参数解析

jQuery插件HighCharts实现的2D堆条状图效果示例【附demo源码下载】

Python的Bottle框架基本知识总结

实战企业网站SEO优化技巧总结

GTX970M性能倍增神舟战神Z7游戏笔记本首测/图

图之总结

JDK 1.8 之 Map.merge()

springboot系列之01-产生的背景及其优势

Spring5源码解析4-refresh方法之invokeBeanFactoryPostProcessors

Docker学习笔记之容器查看启动终止删除的方法

jQuery插件HighCharts绘制的2D堆柱状图效果示例【附demo源码下载】

mybatis查询语句的背后之参数解析

jQuery插件HighCharts实现的2D堆条状图效果示例【附demo源码下载】

Python的Bottle框架基本知识总结

实战企业网站SEO优化技巧总结

GTX970M性能倍增 神舟战神Z7游戏笔记本首测/图

GTX970M性能倍增神舟战神Z7游戏笔记本首测/图