【华为OD】Linux发行版的数量
【华为OD】Linux发行版的数量
题目描述
Linux 操作系统有多个发行版,distrowatch.com 提供了各个发行版的资料。这些发行版互相存在关联,例如 Ubuntu 基于 Debian 开发,而 Mint 又基于 Ubuntu 开发,那么我们认为 Mint 同 Debian 也存在关联。
发行版集是一个或多个相关存在关联的操作系统发行版,集合内不包含没有关联的发行版。
给你一个 n x n 的关联矩阵 isConnected,其中 isConnected[i][j] = 1 表示第 i 个发行版和第 j 个发行版直接关联,而 isConnected[i][j] = 0 表示二者不直接相连。
返回最大的发行版集中发行版的数量。
输入描述
第一行输入发行版的总数量 N,之后每行表示各发行版间是否直接相关。
输出描述
输出最大的发行版集中发行版的数量
说明
1 <= N <= 200
示例
示例一
输入:
4
1 1 0 0
1 1 1 0
0 1 1 0
0 0 0 1
输出:
3
说明:
Debian(1)和 Ubuntu(2)相关,Mint(3)和 Ubuntu(2)相关,EeulerOS(4)和另外三个都不相关,所以存在两个发行版集,发行版集中发行版的数量分别是 3 和 1,所以输出 3
解题思路
这是一个典型的无向图连通分量问题。我们需要找到图中最大连通分量的大小。
核心思想:
- 将发行版关联矩阵看作无向图的邻接矩阵
- 使用图遍历算法(DFS或BFS)找出所有连通分量
- 返回最大连通分量的节点数量
关键概念:
- 连通分量:图中任意两个节点都可以通过路径相互到达的最大子图
- 邻接矩阵:isConnected[i][j] = 1 表示节点i和节点j直接相连
我将提供两种解法:深度优先搜索法(DFS)和广度优先搜索法(BFS)。
解法一:深度优先搜索法(DFS)
使用DFS遍历图,对每个未访问的节点开始DFS,统计每个连通分量的大小。
Java实现
import java.util.*;public class Solution1 {public static void main(String[] args) {Scanner sc = new Scanner(System.in);int n = sc.nextInt();int[][] isConnected = new int[n][n];for (int i = 0; i < n; i++) {for (int j = 0; j < n; j++) {isConnected[i][j] = sc.nextInt();}}int result = findLargestComponent(isConnected, n);System.out.println(result);sc.close();}private static int findLargestComponent(int[][] isConnected, int n) {boolean[] visited = new boolean[n];int maxSize = 0;for (int i = 0; i < n; i++) {if (!visited[i]) {int size = dfs(isConnected, visited, i, n);maxSize = Math.max(maxSize, size);}}return maxSize;}private static int dfs(int[][] isConnected, boolean[] visited, int node, int n) {visited[node] = true;int size = 1; // 当前节点计入大小for (int i = 0; i < n; i++) {if (isConnected[node][i] == 1 && !visited[i]) {size += dfs(isConnected, visited, i, n);}}return size;}
}
Python实现
def dfs(is_connected, visited, node, n):visited[node] = Truesize = 1 # 当前节点计入大小for i in range(n):if is_connected[node][i] == 1 and not visited[i]:size += dfs(is_connected, visited, i, n)return sizedef find_largest_component(is_connected, n):visited = [False] * nmax_size = 0for i in range(n):if not visited[i]:size = dfs(is_connected, visited, i, n)max_size = max(max_size, size)return max_sizedef solve_dfs():n = int(input())is_connected = []for _ in range(n):row = list(map(int, input().split()))is_connected.append(row)result = find_largest_component(is_connected, n)print(result)solve_dfs()
C++实现
#include <iostream>
#include <vector>
#include <algorithm>
using namespace std;int dfs(vector<vector<int>>& isConnected, vector<bool>& visited, int node, int n) {visited[node] = true;int size = 1; // 当前节点计入大小for (int i = 0; i < n; i++) {if (isConnected[node][i] == 1 && !visited[i]) {size += dfs(isConnected, visited, i, n);}}return size;
}int findLargestComponent(vector<vector<int>>& isConnected, int n) {vector<bool> visited(n, false);int maxSize = 0;for (int i = 0; i < n; i++) {if (!visited[i]) {int size = dfs(isConnected, visited, i, n);maxSize = max(maxSize, size);}}return maxSize;
}int main() {int n;cin >> n;vector<vector<int>> isConnected(n, vector<int>(n));for (int i = 0; i < n; i++) {for (int j = 0; j < n; j++) {cin >> isConnected[i][j];}}int result = findLargestComponent(isConnected, n);cout << result << endl;return 0;
}
解法二:广度优先搜索法(BFS)
使用BFS遍历图,对每个未访问的节点开始BFS,统计每个连通分量的大小。
Java实现
import java.util.*;public class Solution2 {public static void main(String[] args) {Scanner sc = new Scanner(System.in);int n = sc.nextInt();int[][] isConnected = new int[n][n];for (int i = 0; i < n; i++) {for (int j = 0; j < n; j++) {isConnected[i][j] = sc.nextInt();}}int result = findLargestComponentBFS(isConnected, n);System.out.println(result);sc.close();}private static int findLargestComponentBFS(int[][] isConnected, int n) {boolean[] visited = new boolean[n];int maxSize = 0;for (int i = 0; i < n; i++) {if (!visited[i]) {int size = bfs(isConnected, visited, i, n);maxSize = Math.max(maxSize, size);}}return maxSize;}private static int bfs(int[][] isConnected, boolean[] visited, int start, int n) {Queue<Integer> queue = new LinkedList<>();queue.offer(start);visited[start] = true;int size = 0;while (!queue.isEmpty()) {int node = queue.poll();size++;for (int i = 0; i < n; i++) {if (isConnected[node][i] == 1 && !visited[i]) {visited[i] = true;queue.offer(i);}}}return size;}
}
Python实现
from collections import dequedef bfs(is_connected, visited, start, n):queue = deque([start])visited[start] = Truesize = 0while queue:node = queue.popleft()size += 1for i in range(n):if is_connected[node][i] == 1 and not visited[i]:visited[i] = Truequeue.append(i)return sizedef find_largest_component_bfs(is_connected, n):visited = [False] * nmax_size = 0for i in range(n):if not visited[i]:size = bfs(is_connected, visited, i, n)max_size = max(max_size, size)return max_sizedef solve_bfs():n = int(input())is_connected = []for _ in range(n):row = list(map(int, input().split()))is_connected.append(row)result = find_largest_component_bfs(is_connected, n)print(result)solve_bfs()
C++实现
#include <iostream>
#include <vector>
#include <queue>
#include <algorithm>
using namespace std;int bfs(vector<vector<int>>& isConnected, vector<bool>& visited, int start, int n) {queue<int> q;q.push(start);visited[start] = true;int size = 0;while (!q.empty()) {int node = q.front();q.pop();size++;for (int i = 0; i < n; i++) {if (isConnected[node][i] == 1 && !visited[i]) {visited[i] = true;q.push(i);}}}return size;
}int findLargestComponentBFS(vector<vector<int>>& isConnected, int n) {vector<bool> visited(n, false);int maxSize = 0;for (int i = 0; i < n; i++) {if (!visited[i]) {int size = bfs(isConnected, visited, i, n);maxSize = max(maxSize, size);}}return maxSize;
}int main() {int n;cin >> n;vector<vector<int>> isConnected(n, vector<int>(n));for (int i = 0; i < n; i++) {for (int j = 0; j < n; j++) {cin >> isConnected[i][j];}}int result = findLargestComponentBFS(isConnected, n);cout << result << endl;return 0;
}
解法三:并查集法(Union-Find)
使用并查集数据结构来解决连通分量问题,这是另一种经典方法。
Java实现
import java.util.*;public class Solution3 {static class UnionFind {private int[] parent;private int[] size;private int maxSize;public UnionFind(int n) {parent = new int[n];size = new int[n];maxSize = 1;for (int i = 0; i < n; i++) {parent[i] = i;size[i] = 1;}}public int find(int x) {if (parent[x] != x) {parent[x] = find(parent[x]); // 路径压缩}return parent[x];}public void union(int x, int y) {int rootX = find(x);int rootY = find(y);if (rootX != rootY) {// 按大小合并if (size[rootX] < size[rootY]) {int temp = rootX;rootX = rootY;rootY = temp;}parent[rootY] = rootX;size[rootX] += size[rootY];maxSize = Math.max(maxSize, size[rootX]);}}public int getMaxSize() {return maxSize;}}public static void main(String[] args) {Scanner sc = new Scanner(System.in);int n = sc.nextInt();UnionFind uf = new UnionFind(n);for (int i = 0; i < n; i++) {for (int j = 0; j < n; j++) {int connected = sc.nextInt();if (connected == 1 && i != j) {uf.union(i, j);}}}System.out.println(uf.getMaxSize());sc.close();}
}
Python实现
class UnionFind:def __init__(self, n):self.parent = list(range(n))self.size = [1] * nself.max_size = 1def find(self, x):if self.parent[x] != x:self.parent[x] = self.find(self.parent[x]) # 路径压缩return self.parent[x]def union(self, x, y):root_x = self.find(x)root_y = self.find(y)if root_x != root_y:# 按大小合并if self.size[root_x] < self.size[root_y]:root_x, root_y = root_y, root_xself.parent[root_y] = root_xself.size[root_x] += self.size[root_y]self.max_size = max(self.max_size, self.size[root_x])def get_max_size(self):return self.max_sizedef solve_union_find():n = int(input())uf = UnionFind(n)for i in range(n):row = list(map(int, input().split()))for j in range(n):if row[j] == 1 and i != j:uf.union(i, j)print(uf.get_max_size())solve_union_find()
C++实现
#include <iostream>
#include <vector>
#include <algorithm>
using namespace std;class UnionFind {
private:vector<int> parent;vector<int> size;int maxSize;public:UnionFind(int n) : parent(n), size(n, 1), maxSize(1) {for (int i = 0; i < n; i++) {parent[i] = i;}}int find(int x) {if (parent[x] != x) {parent[x] = find(parent[x]); // 路径压缩}return parent[x];}void unite(int x, int y) {int rootX = find(x);int rootY = find(y);if (rootX != rootY) {// 按大小合并if (size[rootX] < size[rootY]) {swap(rootX, rootY);}parent[rootY] = rootX;size[rootX] += size[rootY];maxSize = max(maxSize, size[rootX]);}}int getMaxSize() {return maxSize;}
};int main() {int n;cin >> n;UnionFind uf(n);for (int i = 0; i < n; i++) {for (int j = 0; j < n; j++) {int connected;cin >> connected;if (connected == 1 && i != j) {uf.unite(i, j);}}}cout << uf.getMaxSize() << endl;return 0;
}
算法复杂度分析
解法一:深度优先搜索法(DFS)
- 时间复杂度:O(N²),需要遍历整个邻接矩阵
- 空间复杂度:O(N),递归栈深度和visited数组
解法二:广度优先搜索法(BFS)
- 时间复杂度:O(N²),需要遍历整个邻接矩阵
- 空间复杂度:O(N),队列和visited数组
解法三:并查集法(Union-Find)
- 时间复杂度:O(N² × α(N)),其中α是阿克曼函数的反函数,实际上近似O(N²)
- 空间复杂度:O(N),parent和size数组
算法原理详解
核心思想
这个问题本质上是求无向图的最大连通分量大小。三种解法的核心思想:
- DFS/BFS:通过图遍历找到所有连通分量
- 并查集:通过合并操作将相连的节点归并到同一集合
关键概念
- 连通分量:图中任意两个节点都可以通过路径相互到达的最大子图
- 邻接矩阵:isConnected[i][j] = 1 表示节点i和节点j直接相连
- 传递性:如果A连B,B连C,则A和C在同一连通分量中
三种解法的特点
-
DFS法:
- 递归实现,代码简洁
- 适合理解连通性概念
- 可能存在栈溢出风险(深度过大)
-
BFS法:
- 迭代实现,使用队列
- 层次遍历,逻辑清晰
- 空间使用相对稳定
-
并查集法:
- 专门解决动态连通性问题
- 支持高效的合并和查找操作
- 代码相对复杂,但概念重要
示例分析
示例详细分析
给定邻接矩阵:
1 1 0 0
1 1 1 0
0 1 1 0
0 0 0 1
连通关系分析:
- 节点0和节点1直接相连
- 节点1和节点2直接相连
- 通过传递性:节点0、1、2构成一个连通分量
- 节点3独立,构成另一个连通分量
连通分量:
- {0, 1, 2},大小为3
- {3},大小为1
最大连通分量大小为3,所以答案是3。
图示表示
发行版关系图:
Debian(0) ——— Ubuntu(1) ——— Mint(2)EeulerOS(3) (独立)连通分量1: {Debian, Ubuntu, Mint} = 3个节点
连通分量2: {EeulerOS} = 1个节点最大连通分量大小 = 3
优化技巧
1. 输入处理优化
// 可以在读入时直接处理连接关系
for (int i = 0; i < n; i++) {for (int j = 0; j < n; j++) {int val = sc.nextInt();if (val == 1 && i != j) {// 直接处理连接关系uf.union(i, j);}}
}
2. DFS递归深度优化
// 使用迭代版本的DFS避免栈溢出
private static int dfsIterative(int[][] isConnected, boolean[] visited, int start, int n) {Stack<Integer> stack = new Stack<>();stack.push(start);visited[start] = true;int size = 0;while (!stack.isEmpty()) {int node = stack.pop();size++;for (int i = 0; i < n; i++) {if (isConnected[node][i] == 1 && !visited[i]) {visited[i] = true;stack.push(i);}}}return size;
}
3. 并查集路径压缩优化
// 带路径压缩的查找操作
public int find(int x) {if (parent[x] != x) {parent[x] = find(parent[x]); // 路径压缩}return parent[x];
}
扩展应用
1. 朋友圈问题
这个算法可以直接应用于朋友圈问题:给定人员关系矩阵,求最大朋友圈的大小。
2. 网络连通性
在网络拓扑中,可以用来分析网络的连通性和找出最大的连通子网。
3. 社交网络分析
在社交网络中,可以用来找出最大的社交群体。
总结
三种解法都能正确解决问题,选择建议:
-
DFS法:
- 代码简洁,易于理解
- 适合小规模数据
- 推荐用于面试和学习
-
BFS法:
- 逻辑清晰,避免递归风险
- 适合中等规模数据
- 推荐用于实际应用
-
并查集法:
- 专业的连通性解决方案
- 适合大规模数据和动态更新
- 推荐深入学习数据结构
核心要点:
- 理解连通分量的概念和传递性
- 掌握图遍历的基本方法(DFS/BFS)
- 了解并查集这一重要数据结构
- 注意邻接矩阵的对称性(无向图)
对于华为OD机试,建议优先掌握DFS法,因为它最直观易懂,代码量适中,且能很好地展示对图论基础概念的理解。