数据结构：最短路径

在实际应用中，最短路径算法被广泛应用于网络路由、交通规划、物流配送等领域。例如，在物流管理中，通过优化整个物流体系，实现最短路径、最低成本的物流管理，可以有效降低物流成本，提高效率。因此，了解最短路径的概念和算法对于解决实际问题具有重要意义。

一、最短路径问题

假若要在计算机上建立一个交通咨询系统，则可以采用图的结构来表示实际的交通网络。如下图所示，图中顶点表示城市，边表示城市间的交通联系。例如，一位旅客要从A城到B城，他希望选择一条中转次数最少的路线。

假设图中每一站都需要换车，则这个问题反映到图上就是要找一条从顶点A到B所含边的数目最少的路径。只需从顶点A出发对图做广度优先搜索，一旦遇到顶点B就终止。由此所得的广度优先生成树上，从根顶点A到顶点B的路径就是中转次数最少的路径，路径上A与B之间的顶点数就是中转次数，但是，这只是一类最简单的图的最短路径问题。

有时，对于旅客来说，可能更关心的是节省交通费用；而对于司机来说，里程和速度则是他们感兴趣的信息。为了在图上表示有关信息，可对边赋以权，权的值表示两城市间的距离，或途中所需时间，或交通费用等。此时路径长度的度量就不再是路径上边的数目，而是路径上边的权值之和。

考虑到交通图的有向性，例如，汽车的上山和下山，轮船的顺水和逆水，所花费的时间或代价就不相同，所以交通网往往是用带权有向网表示。在带权有向网中，习惯上称路径上的第一个顶点为源点（Source），最后一个顶点为终点（Destination）。

最常见的最短路径问题有两种：一种是求从某个源点到其余各顶点的最短路径，另一种是求每一对顶点之间的最短路径。下面，我们将分别讨论这两种最短路径问题。

二、迪杰斯特拉算法

从某个源点到其余各顶点的最短路径，也称单源点最短路径问题。即，给定带权有向图G和源点 $v_0$ ，求从 $v_0$ 到G中其余各顶点的最短路径。迪杰斯特拉（Dijkstra）提出了一个按路径长度递增的次序产生最短路径的算法，因此称为迪杰斯特拉算法。

2.1、求解过程

对于网G=(V, E)，迪杰斯特拉算法的求解过程如下：

首先，将G中的顶点分成两组：第一组S，为已求出最短路径的终点集合（初始时只包含源点 $v_0$ ）；第二组V-S，为尚未求出最短路径的顶点集合（初始时为 $V-\{v_0\}$ ）。
然后，按各顶点与 $v_0$ 间最短路径长度递增的次序，逐个将集合V-S中的顶点并入到集合S中。在这个过程中，总保持从 $v_0$ 到集合S中各顶点的路径长度始终不大于到集合V-S中各顶点的路径长度。

这种求解方法能确保是正确的。因为，假设S为已求得最短路径的终点的集合，则可证明：下一条最短路径（设其终点为x）或者是边(v, x)，或者是中间只经过S中的顶点而最后到达顶点x的路径。这可用反证法来证明。假设此路径上有一个顶点不在S中，则说明存在一条终点不在S而长度比此路径短的路径。但是，这是不可能的。因为算法是按路径长度递增的次序来产生最短路径的，故长度比此路径短的所有路径均已产生，它们的终点必定在S中，即假设不成立。

例如，下图是一个带权有向图：

下表是从图中顶点 $v_0$ 到其余各顶点的最短路径：

源点	终点	最短路径	路径长度
$v_0$	$v_2$	$(v_0,v_2)$	10
$v_0$	$v_4$	$(v_0,v_4)$	30
$v_0$	$v_3$	$(v_0,v_4,v_3)$	50
$v_0$	$v_5$	$(v_0,v_4,v_3,v_5)$	60
$v_0$	$v_1$	无	$\infty$

根据迪杰斯特拉算法的求解过程，按路径长度递增的次序，首先求出 $v_0$ 到 $v_2$ 的路径 $(v_0,v_2)$ ，然后依次求得 $v_0$ 到 $v_4$ 的路径 $(v_0,v_4)$ ， $v_0$ 到 $v_3$ 的路径 $(v_0,v_4,v_3)$ ， $v_0$ 到 $v_5$ 的路径 $(v_0,v_4,v_3,v_5)$ ，而从 $v_0$ 到 $v_1$ 没有路径。

2.2、算法步骤

假设用带权的邻接矩阵arcs来表示带权有向网G， $G.arcs[i][j]$ 表示弧 $<v_i, v_j>$ 上的权值。若 $<v_i, v_j>$ 不存在，则置 $G.arcs[i][j]$ 为无穷大。求源点 $v_0$ 到其余各顶点的算法实现要引入以下辅助数据结构：

一维数组S[i]：记录从源点 $v_0$ 到终点 $v_i$ 的最短路径是否已被确定，true表示已经确定，false表示尚未确定。
一维数组Path[i]：记录从源点 $v_0$ 到终点 $v_i$ 的当前最短路径上 $v_i$ 的直接前驱顶点序号。其初值为：如果从 $v_0$ 到 $v_i$ 有弧，则Path[i]为 $v_0$ ；否则为-1。
一维数组D[i]：记录从源点 $v_0$ 到终点 $v_i$ 的当前最短路径长度。其初值为：如果从 $v_0$ 到 $v_i$ 有弧，则D[i]为弧上的权值；否则为无穷大。

显然，长度最短的一条最短路径必为 $(v_0, v_k)$ ，其满足以下条件：

D[k]=Min\{D[i] | v_i \in V-S \}

当求得从顶点 $v_0$ 到 $v_k$ 的最短路径后，将 $v_k$ 加入到第一组顶点集S中。每当加入一个新的顶点到顶点集S，对第二组剩余的各个顶点而言，多了一个“中转”顶点，从而多了一条“中转”路径，所以要对第二组剩余的各个顶点的最短路径长度进行更新。例如，原来 $v_0$ 到 $v_i$ 的最短路径长度为D[i]，加进 $v_k$ 之后，以 $v_k$ 作为中间顶点的“中转”路径长度为： $D[k]+G.arcs[k][i]$ ，若 $D[k]+G.arcs[k][i]<D[i]$ ，则用 $D[k]+G.arcs[k][i]$ 取代D[i]。更新后，再选择数组D中值最小的顶点加入到第一组顶点集S中，如此进行下去，直到图中所有顶点都加入到第一组顶点集S中为止。

迪杰斯特拉算法的步骤为：

初始化：
- 将源点 $v_0$ 加到S中，即 $S[v_0]=true$ ；
- 将 $v_0$ 到各个终点的最短路径长度初始化为权值，即 $D[i]=G.arcs[v_0][v_i], (v_i \in V-S)$ ；
- 如果 $v_0$ 和顶点 $v_i$ 之间有弧，则将 $v_i$ 的前驱置为 $v_0$ ，即 $Path[i]=v_0$ ，否则 $Path[i]=-1$ 。
循环n-1次，执行以下操作：
- 选择下一条最短路径的终点 $v_k$ ，使得： $D[k]=Min\{D[i] | v_i \in V-S \}$
- 将 $v_k$ 加到S中，即 $S[v_k]=true$ ；
- 更新从 $v_0$ 出发到集合V-S中任一顶点的最短路径的长度，若 $D[k]+G.arcs[k][i]<D[i]$ ，则更新 $D[i]=D[k]+G.arcs[k][i]$ ，同时更改 $v_i$ 的前驱为 $v_k$ ，即Path[i]=k。

2.3、算法描述

迪杰斯特拉算法的C语言描述如下：

// 用迪杰斯特拉算法求有向网G的顶点v0到其余各顶点的最短路径
void ShortestPath(AMGraph G, int v0) {
    // n为G中顶点的个数
    n=G.vexnum;
    // 依次初始化所有顶点
    for(v=0;v<n;++v) {
        // S初始为空集
        S[v]=false;
        // 将v0到其余个顶点的最短路径长度初始化为弧上的权值
        D[v]=G.arcs[v0][v]
        // 如果v0和v之间有弧，则将v的前驱置为v0，否则置为-1
        if(D[v]<MaxInt) Path[v]=v0;
        else Path[v]=-1;
    }
    // 将v0加入S
    S[v0]=true;
    // 源点到源点的距离为0
    D[v0]=0;

    // 循环n-1次，每次求得v0到某个顶点v的最短路径
    for(i=1;i<n;++i) {
        min=MaxInt;
        // 选择一条当前的最短路径，其终点为v
        for(w=0;w<n;++w) {
            if(!S[w]&&D[w]<min) {
                v=w;
                min=D[w];
            }
        }
        // 将顶点v并入S
        S[v]=true;
        // 更新从v0到V-S中所有顶点的最短路径长度
        for(w=0;w<n;++w) {
            if(!S[w]&&(D[v]+G.arcs[v][w]<D[w])) {
                // 更新D[w]
                D[w]=D[v]+G.arcs[v][w];
                // 更新w的前驱为v
                Path[w]=v;
            }
        }
    }
}

2.4、示例说明

利用迪杰斯特拉算法，对下图所示的有向网G求解最短路径，给出算法中各参量的初始化结果和求解过程中的变化。

对图中个顶点依次初始化，迪杰斯特拉算法初始化结果，如下表：

迪杰斯特拉算法求解过程中各参量的变化，如下表

如何从上表读取源点 $v_0$ 到终点 $v_k$ 的最短路径？以顶点 $v_5$ 为例：

1
2
3

Path[5]=3
Path[3]=4
Path[4]=0

反过来排列，得到路径0、4、3、5，这就是源点 $v_0$ 到终点 $v_k$ 的最短路径。

2.5、算法分析

迪杰斯特拉算法的主循环共进行n−1次，每次执行的时间是O(n)，所以算法的时间复杂度是 $O(n^2)$ 。

如果用带权的邻接表作为有向图的存储结构，则虽然更新数组D的时间可以减少，但由于在D中找出最短路径的时间不变，所以时间复杂度仍为 $O(n^2)$ 。

在实际应用中，人们可能只希望找到从某个源点出发，到某一个特定终点的最短路径。但是，这个问题和单求源点到其他所有顶点的最短路径一样复杂，也需要利用迪杰斯特拉算法来解决，其时间复杂度仍为 $O(n^2)$ 。

三、弗洛伊德算法

求解每一对顶点之间的最短路径有两种方法：其一是分别以图中的每个顶点为源点共调用n次迪杰斯特拉算法；其二是采用弗洛伊德（Floyd）算法。下面，我们终点讨论弗洛伊德算法。

3.1、算法步骤

弗洛伊德算法仍然使用带权的邻接矩阵arcs来表示有向网G。求从顶点 $v_i$ 到 $v_j$ 的最短路径的算法实现要引入以下辅助的数据结构：

二维数组Path[i][j]：记录最短路径上顶点 $v_j$ 的前一顶点的序号。
二维数组D[i][j]：记录顶点 $v_i$ 和 $v_j$ 之间的最短路径长度。

弗洛伊德算法的步骤为：

初始化 $v_i$ 到 $v_j$ 的最短路径长度，即 $D[i][j]=G.arcs[i][j]$ ；
进行n次比较和更新：
- 在 $v_i$ 和 $v_j$ 间加入顶点 $v_0$ ，比较 $(v_i, v_j)$ 和 $(v_i, v_0, v_j)$ 的路径长度，取其中较短者作为 $v_i$ 到 $v_j$ 的中间顶点序号不大于0的最短路径。
- 在 $v_i$ 和 $v_j$ 间加入顶点 $v_1$ ，得到 $(v_i,...,v_1)$ 和 $(v_1,...,v_j)$ ，其中 $(v_i,...,v_1)$ 是 $v_i$ 到 $v_1$ 的中间顶点序号不大于0的最短路径， $(v_1,...,v_j)$ 是 $v_1$ 到 $v_j$ 的中间顶点序号不大于0的最短路径，这两条路径已在上一步中求出。比较 $(v_i,...,v_1,...,v_j)$ 与上一步求出的 $v_i$ 到 $v_j$ 的中间顶点序号不大于0的最短路径，取其中较短者作为 $v_i$ 到 $v_j$ 的中间顶点序号不大于1的最短路径。
- 依次类推，在 $v_i$ 和 $v_j$ 间加入顶点 $v_k$ ，若 $(v_i,...,v_k)$ 和 $(v_k,...,v_j)$ 分别是从 $v_i$ 到 $v_k$ 和 $v_k$ 到 $v_j$ 的中间顶点序号不大于k-1的最短路径，则将 $(v_i,...,v_k,...,v_j)$ 和已经得到的从 $v_i$ 到 $v_j$ 且中间顶点序号不大于k-1的最短路径相比较，其长度较短者便是从 $v_i$ 到 $v_j$ 的中间顶点序号不大于k的最短路径。
- 这样，经过n次比较后，最后求得的必是从 $v_i$ 到 $v_j$ 的最短路径。按此方法，可以同时求得各对顶点间的最短路径。

根据上述求解过程，图中所有顶点对 $(v_i,v_j)$ 间的最短路径长度对应一个n阶方阵D。在上述n+1步中，D的值不断变化，可对应到一个n阶方阵序列。这个n阶方阵序列可定义为：

D^{(-1)},D^{(0)},D^{(1)},...,D^{(k)},...,D^{(n-1)}

其中，

D^{(-1)}[i][j]=G.arcs[i][j]

D^{(k)}[i][j]=min\{D^{(k-1)}[i][j],D^{(k-1)}[i][k]+D^{(k-1)}[k][j]\} \quad 0 \le k \le n-1

显然， $D^{(1)}[i][j]$ 是从 $v_i$ 到 $v_j$ 的中间顶点序号不大于1的最短路径的长度； $D^{(k)}[i][j]$ 是从 $v_i$ 到 $v_j$ 的中间顶点序号不大于k的最短路径的长度； $D^{(n-1)}[i][j]$ 是从 $v_i$ 到 $v_j$ 的最短路径的长度。

3.2、算法描述

弗洛伊德算法的C语言描述如下：

// 用弗洛伊德算法求有向网G中各对顶点i和i之间的最短路径
void ShortestPath_Floyd(AMGraph G) {
    // 初始化各对顶点之间的路径以及距离
    for(i=0;i<G.vexnum;++i) {
        for(j=0;j<G.verxnum;++j) {
            D[i][j]=G.arcs[i][j];
            // 如果i和j之间有弧，则将j的前驱置为i，否则置为-1
            if(D[i][j]<MaxInt) Path[i][j]=i;
            else Path[i][j]=-1;
        }
    }

    // 进行n次比较和更新
    for(k=0;k<G.vexnum;++k) {
        for(i=0;i<G.vexnum;++i) {
            for(j=0;i<G.vexnum;++j) {
                // 从i经k到j的一条路径更短
                if(D[i][k]+D[k][j]<D[i][j]) {
                    // 更新D[i][j]
                    D[i][j]=D[i][k]+D[k][j];
                    // 更新j的前驱为k
                    Path[i][j]=Path[k][j];
                }
            }
        }
    }
}

3.3、示例说明

利用弗洛伊德算法，对下图所示的有向网G求解最短路径，，给出每一对顶点之间的最短路径及其路径长度在求解过程中的变化。

每一对顶点i和j之间的最短路径长度D[i][j]和最短路径Path[i][j]在求解过程中的变化，如下表：

3.4、算法分析

弗洛伊德算法的主循环共进行n次，每次执行的时间是 $O(n^2)$ ，所以算法的时间复杂度是 $O(n^3)$ 。调用n次迪杰斯特拉算法的间复杂度也是 $O(n^3)$ ，但弗洛伊德算法在形式上更加简单。

四、小结

最常见的最短路径问题有两种：一种是求从某个源点到其余各顶点的最短路径，另一种是求每一对顶点之间的最短路径。迪杰斯特拉算法，求从某个源点到其余各顶点的最短路径，求解过程是按路径长度递增的次序产生最短路径，时间复杂度是 $O(n2)$ 。弗洛伊德算法，求每一对顶点之间的最短路径，时间复杂度是 $O(n^3)$ ，从实现形式上来说，这种算法比以图中的每个顶点为源点调用n次迪杰斯特拉算法更为简洁。

五、参考

《数据结构（C语言版第2版）》

《数据结构自考02331》

数据结构

#数据结构

数据结构：最短路径

https://kuberxy.github.io/2024/02/25/数据结构：最短路径/

作者

Mr.x

发布于

2024年2月25日

许可协议

数据结构：拓扑排序上一篇

数据结构：最小生成树下一篇