寫文章

首頁手記并查集入門教程：從基礎到應用

并查集入門教程：從基礎到應用

標簽：

算法與數據結構

概述

并查集是一种高效的数据结构，主要用于解决动态分组问题，支持高效的查找和合并操作。通过路径压缩和按秩合并技术，可以进一步优化并查集的性能。并查集在图的连通性问题、最小生成树算法及社交网络分析等领域有广泛应用。本文全面介绍了并查集的基本概念、操作方法及其实际应用案例。

并查集简介

并查集（Disjoint Set Union，简称 DSU 或 Union-Find）是一种非常实用的数据结构，主要用于解决动态分组问题。并查集支持高效的查找和合并操作，常常用于处理图的连通性问题、最小生成树算法等。

定义与基本概念

并查集主要用来管理一组不相交的集合。每个集合由一个代表元素（通常称为根节点或父节点）表示。每个元素属于一个且仅属于一个集合。并查集支持以下两种基本操作：

查找：确定一个元素的集合。
合并：将两个集合合并为一个。

并查集的作用与应用场景

并查集在很多实际问题中都有广泛应用，例如：

图的连通性问题：判断图中两个节点是否属于同一连通分量。
最小生成树算法（如 Kruskal 算法）：不断添加边，同时保证不会形成环。
社交网络分析：确定社交网络中不同用户群体的划分。

并查集的数据结构

并查集的数据结构主要通过一个数组来实现，数组中的每个元素存储其父节点的索引。通过这种方式，可以表示一棵树结构，其中每个节点指向其父节点，根节点的父节点指向自身。

集合的表示方式

并查集中的每个元素都存储在一个数组中。数组的索引表示元素本身，而数组的值表示该元素的父节点。例如：

parent = [0, 1, 2, 3]

在上述数组中，parent[0] 是 0，parent[1] 是 1，parent[2] 是 2，parent[3] 是 3。这意味着每个元素的父节点都是它自己，即每个元素都属于独立的集合。

父节点数组的构建

父节点数组的构建可以通过一个简单的函数实现。假设初始化时，每个元素的父节点都是它自己。

def make_set(n):
    parent = [i for i in range(n)]
    return parent

在上述代码中，make_set(n) 函数创建了一个包含 n 个元素的父节点数组，每个元素的父节点都是它自己。

并查集的基本操作

并查集支持的主要操作是查找根节点和合并两个集合。

查找根节点

查找根节点的操作是递归地查找每个节点的父节点，直到找到根节点（根节点的父节点是它自己）。

def find(x, parent):
    if parent[x] == x:
        return x
    return find(parent[x], parent)

在上述代码中，find(x, parent) 函数递归地查找节点 x 的根节点。如果节点 x 的父节点是它自己，则直接返回 x，否则继续查找 x 的父节点的根节点。

合并两个集合

合并两个集合的操作是将一个集合的根节点指向另一个集合的根节点。

def union(x, y, parent):
    root_x = find(x, parent)
    root_y = find(y, parent)
    parent[root_x] = root_y

在上述代码中，union(x, y, parent) 函数首先查找两个节点 x 和 y 的根节点 root_x 和 root_y，然后将 root_x 的父节点指向 root_y，从而将两个集合合并。

路径压缩技术

路径压缩是一种优化技术，用于提高查找操作的效率。路径压缩的基本思想是在查找操作中，将路径上的每个节点的父节点直接指向根节点。

路径压缩的原理

路径压缩的原理是，在查找一个节点的根节点时，将路径上的所有节点的父节点直接指向根节点，这样以后查找这些节点时，可以直接找到根节点。

路径压缩的实现方法

路径压缩可以通过修改查找操作的实现来实现。具体代码如下：

def find(x, parent):
    if parent[x] == x:
        return x
    parent[x] = find(parent[x], parent)  # Path compression
    return parent[x]

在上述代码中，find(x, parent) 函数在递归查找节点 x 的根节点时，将节点 x 的父节点指向根节点，从而实现路径压缩。

按秩合并技术

按秩合并是一种优化技术，用于减少合并操作的次数，从而提高合并操作的效率。按秩合并的基本思想是在合并两个集合时，选择秩较小的集合合并到秩较大的集合。

按秩合并的原理

按秩合并的原理是，在合并两个集合时，选择秩较小的集合合并到秩较大的集合。这样可以减少树的高度，提高查找操作的效率。

按秩合并的实现步骤

按秩合并可以通过增加一个秩数组来实现。秩数组表示每个集合树的高度。具体代码如下：

def make_set(n):
    parent = [i for i in range(n)]
    rank = [0] * n
    return parent, rank

def find(x, parent, rank):
    if parent[x] == x:
        return x
    parent[x] = find(parent[x], parent, rank)  # Path compression
    return parent[x]

def union(x, y, parent, rank):
    root_x = find(x, parent, rank)
    root_y = find(y, parent, rank)
    if rank[root_x] < rank[root_y]:
        parent[root_x] = root_y
    elif rank[root_x] > rank[root_y]:
        parent[root_y] = root_x
    else:
        parent[root_y] = root_x
        rank[root_x] += 1

在上述代码中，make_set(n) 函数创建了父节点数组和秩数组。find(x, parent) 函数实现路径压缩。而 union(x, y, parent, rank) 函数在合并两个集合时，选择秩较小的集合合并到秩较大的集合，并在秩相同时更新秩数组。

实际应用案例

并查集在实际问题中有很多应用场景，下面通过两个具体的例子进行详细说明：图的连通性问题和最小生成树算法。

图的连通性问题

图的连通性问题是指判断图中两个节点是否属于同一连通分量。可以使用并查集来解决这个问题。

具体实现如下：

def is_connected(graph):
    parent, _ = make_set(len(graph))
    for i in range(len(graph)):
        for j in range(i + 1, len(graph)):
            if graph[i][j]:
                union(i, j, parent)
    for i in range(len(graph)):
        for j in range(i + 1, len(graph)):
            if graph[i][j] and find(i, parent) != find(j, parent):
                return False
    return True

# Example usage
graph = [
    [0, 1, 0, 0],
    [1, 0, 1, 0],
    [0, 1, 0, 1],
    [0, 0, 1, 0]
]
print(is_connected(graph))  # Output: True

在上述代码中，is_connected(graph) 函数通过遍历图的邻接矩阵，判断两个节点是否属于同一连通分量。如果所有相邻节点都在同一个连通分量内，则整个图是连通的。

图的最小生成树算法

最小生成树算法（如 Kruskal 算法）用于在图中找到连接所有节点的最小权重集合，且这个集合中没有任何环。Kruskal 算法常使用并查集来解决这个问题。

具体实现如下：

def find(x, parent, rank):
    if parent[x] == x:
        return x
    parent[x] = find(parent[x], parent, rank)  # Path compression
    return parent[x]

def union(x, y, parent, rank):
    root_x = find(x, parent, rank)
    root_y = find(y, parent, rank)
    if rank[root_x] < rank[root_y]:
        parent[root_x] = root_y
    elif rank[root_x] > rank[root_y]:
        parent[root_y] = root_x
    else:
        parent[root_y] = root_x
        rank[root_x] += 1

def kruskal(edges, n):
    parent, rank = make_set(n)
    edges.sort(key=lambda x: x[2])  # Sort edges by weight
    mst = []
    for edge in edges:
        u, v, weight = edge
        if find(u, parent, rank) != find(v, parent, rank):
            union(u, v, parent, rank)
            mst.append(edge)
    return mst

# Example usage
edges = [
    (0, 1, 10),
    (0, 2, 15),
    (1, 2, 12),
    (1, 3, 14),
    (2, 3, 16),
    (3, 4, 20)
]
n = 5
print(kruskal(edges, n))  # Output: [(0, 1, 10), (1, 2, 12), (1, 3, 14)]

在上述代码中，kruskal(edges, n) 函数通过 Kruskal 算法找到图的最小生成树。首先对所有边按权重从小到大排序，然后遍历每条边，将不构成环的边添加到最小生成树中。

总结

并查集是一种高效的动态分组数据结构，支持高效的查找和合并操作。在实际应用中，可以通过路径压缩和按秩合并技术进一步优化并查集的性能。并查集在图的连通性问题和最小生成树算法中都有重要应用。通过本文的介绍，读者可以更好地理解和掌握并查集的应用及其优化技术。

點擊查看更多內容

為 TA 點贊

若覺得本文不錯，就分享一下吧！

評論

評論

共同學習，寫下你的評論

評論加載中...

展開查看更多評論

作者其他優(yōu)質文章

正在加載中

蝴蝶刀刀

手記
篇

粉絲

38

獲贊與收藏

184

關注作者，訂閱最新文章

閱讀免費教程

后端通用面試教程

41個小節(jié) 32194 359

網絡編程入門教程

20個小節(jié) 13289 250

Pandas 入門教程

25個小節(jié) 19880 373

推薦

評論

收藏

共同學習，寫下你的評論



感謝您的支持，我會繼續(xù)努力的～

掃碼打賞，你說多少就多少

贊賞金額會直接到老師賬戶

支付方式

打開微信掃一掃，即可進行掃碼打賞哦

今天注冊有機會得

100積分直接送

付費專欄免費學

大額優(yōu)惠券免費領

立即參與放棄機會

點擊
抽獎

慕課手記新用戶專享福利

恭喜你，你的運氣太好了，居然抽中了 100個積分！

恭喜你，抽中了價值元的專欄！

太棒了，直接落到你賬戶里！

積分商城里的羅技鼠標、機械鍵盤、
Kindle 閱讀器、小米平衡車
Apple iPad （10.2英寸）、大額優(yōu)惠券
在等著你去兌換了噢

作者：

免費贈送

兌換碼：1111222211 復制

優(yōu)惠券可用于購買實戰(zhàn)課、體系課
無門檻使用

先去看看，有什么好東西馬上兌換我愛學習，選課去


第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空