当前位置：首页 > news >正文

深入解析数据结构中的表：从数组到哈希表

news 2025/11/6 11:18:55

一、表的本质与分类

1.1 基本概念

表是一种线性数据结构，具有以下核心特性：

元素按特定顺序排列
支持随机访问或顺序访问
可动态扩展或固定大小
元素间存在明确的前驱后继关系

重要术语：

索引：元素的位置标识
容量：表的最大存储能力
负载因子：实际元素数与容量的比值
冲突：不同元素映射到相同位置

1.2 表的分类体系

类型	特性描述	典型实现
数组	连续内存，固定大小	原生数组
动态数组	可扩展的连续内存	std::vector
链表	非连续内存，动态扩展	std::list
哈希表	键值映射，快速查找	std::unordered_map
跳表	多级索引，高效查找	Redis ZSET
稀疏表	高效存储稀疏数据	稀疏矩阵

二、核心数据结构实现

2.1 动态数组（Vector）

template <typename T>
class Vector {
    T* data;
    size_t capacity;
    size_t size;
    
    void resize(size_t new_cap) {
        T* new_data = new T[new_cap];
        for(size_t i=0; i<size; ++i) {
            new_data[i] = move(data[i]);
        }
        delete[] data;
        data = new_data;
        capacity = new_cap;
    }
    
public:
    Vector(size_t cap=16) : data(new T[cap]), capacity(cap), size(0) {}
    
    void push_back(const T& value) {
        if(size == capacity) {
            resize(capacity * 2);
        }
        data[size++] = value;
    }
    
    // 其他操作...
};

2.2 哈希表实现

template <typename K, typename V>
class HashMap {
    struct Node {
        K key;
        V value;
        Node* next;
    };
    
    vector<Node*> table;
    size_t bucket_count;
    size_t size;
    
    size_t hash(const K& key) const {
        return hash<K>{}(key) % bucket_count;
    }
    
public:
    HashMap(size_t buckets=16) 
        : table(buckets, nullptr), bucket_count(buckets), size(0) {}
    
    void insert(const K& key, const V& value) {
        size_t idx = hash(key);
        Node* node = new Node{key, value, table[idx]};
        table[idx] = node;
        ++size;
        
        if(load_factor() > 0.75) {
            rehash();
        }
    }
    
    // 其他操作...
};

三、性能分析与优化

3.1 时间复杂度对比

操作	数组	链表	哈希表
访问	O(1)	O(n)	O(1)
查找	O(n)	O(n)	O(1)
插入	O(n)	O(1)	O(1)
删除	O(n)	O(1)	O(1)
空间复杂度	O(n)	O(n)	O(n)

3.2 内存优化技巧

内存池：预分配节点内存
紧凑存储：使用位域压缩数据
共享内存：相同数据共享存储
延迟初始化：按需分配内存

四、实际应用案例

4.1 数据库索引

class DatabaseIndex {
    unordered_map<string, vector<size_t>> index;
    
public:
    void addRecord(const string& key, size_t recordId) {
        index[key].push_back(recordId);
    }
    
    vector<size_t> query(const string& key) const {
        if(auto it = index.find(key); it != index.end()) {
            return it->second;
        }
        return {};
    }
};

4.2 缓存系统

template <typename K, typename V>
class LRUCache {
    struct Node {
        K key;
        V value;
        Node* prev;
        Node* next;
    };
    
    unordered_map<K, Node*> cache;
    Node* head;
    Node* tail;
    size_t capacity;
    
    void moveToHead(Node* node) {
        removeNode(node);
        addToHead(node);
    }
    
public:
    LRUCache(size_t cap) : capacity(cap), head(new Node), tail(new Node) {
        head->next = tail;
        tail->prev = head;
    }
    
    V get(const K& key) {
        if(auto it = cache.find(key); it != cache.end()) {
            moveToHead(it->second);
            return it->second->value;
        }
        return V{};
    }
    
    // 其他操作...
};

4.3 路由表

class RoutingTable {
    struct TrieNode {
        unordered_map<string, TrieNode*> children;
        string interface;
    };
    
    TrieNode* root;
    
public:
    RoutingTable() : root(new TrieNode) {}
    
    void addRoute(const vector<string>& path, const string& interface) {
        auto node = root;
        for(const auto& part : path) {
            if(!node->children[part]) {
                node->children[part] = new TrieNode;
            }
            node = node->children[part];
        }
        node->interface = interface;
    }
    
    string findRoute(const vector<string>& path) const {
        auto node = root;
        for(const auto& part : path) {
            if(!node->children.count(part)) break;
            node = node->children.at(part);
        }
        return node->interface;
    }
};

五、常见问题与解决方案

5.1 哈希冲突处理

问题：不同键映射到相同位置
解决方案：

链地址法：使用链表存储冲突元素
开放地址法：线性探测、二次探测
再哈希法：使用第二个哈希函数
布谷鸟哈希：使用多个哈希表

5.2 内存碎片

问题：频繁分配释放导致内存碎片
解决方案：

使用内存池
实现自定义分配器
定期整理内存
使用紧凑数据结构

5.3 并发访问

问题：多线程同时访问导致数据竞争
解决方案：

template <typename K, typename V>
class ConcurrentHashMap {
    vector<mutex> mutexes;
    vector<unordered_map<K, V>> segments;
    
    size_t getSegment(const K& key) const {
        return hash<K>{}(key) % mutexes.size();
    }
    
public:
    ConcurrentHashMap(size_t segments=16)
        : mutexes(segments), segments(segments) {}
    
    void insert(const K& key, const V& value) {
        size_t idx = getSegment(key);
        lock_guard<mutex> lock(mutexes[idx]);
        segments[idx][key] = value;
    }
    
    // 其他操作...
};