顺序表:从数组到高效数据管理的进化之路
一、线性表:数据结构的 “基础骨架”
在数据结构的世界里,线性表是最基础的结构之一。它是由n
个具有相同特性的数据元素组成的有限序列,就像一列整齐排列的士兵,每个元素都有唯一的前驱(除了第一个)和后继(除了最后一个)。
常见的线性表形式:顺序表、链表、栈、队列、字符串等。
逻辑与物理结构的区别:
- 逻辑上,线性表是连续的 “直线” 结构;
- 物理存储上,它可以是连续的(如数组)或非连续的(如链表)。
而本文的主角 ——顺序表,就是线性表在物理存储上采用数组实现的经典代表。
二、顺序表:数组的 “豪华升级版”
1. 什么是顺序表?
- 定义:顺序表是一种线性数据结构,其核心特点是物理存储连续。它通过一段地址连续的存储单元(通常为数组)依次存储数据元素,支持高效的随机访问和顺序操作。顺序表是线性表的一种实现方式,与链表不同,它在内存中以连续的块存储数据,类似于“紧密排列的火车车厢”
- 类比理解:
- 数组是 “毛坯房”,仅提供原始存储功能(固定大小,操作需手动管理);
- 顺序表是 “精装房”,在数组基础上增加了 “家具”(操作接口),让数据管理更便捷(提供自动化接口(如动态扩容),更适合实际应用场景)。
// 数组 vs 顺序表 int arr[10]; // 原始数组,仅能存储10个int // 顺序表结构体(动态版) typedef struct SeqList { int* a; // 动态数组,存储数据 int size; // 有效数据个数 int capacity; // 总容量 } SL;
2. 顺序表的分类:静态 vs 动态
(1)静态顺序表:定长数组的 “简单封装”
- 特点:容量在编译时固定,用宏定义或常量指定大小。
#define MAX_SIZE 100 typedef struct { int data[MAX_SIZE]; int length; // 有效数据长度 } StaticSeqList;
- 优缺点:
优点:结构简单,访问元素高效(随机访问 O (1))。
缺点:容量固定,空间不足时无法扩展,空间浪费严重(给多了用不完,给少了不够用)。
(2)动态顺序表:按需扩容的 “灵活容器”
- 核心思想:用动态数组(指针 + 容量管理)实现,空间不足时自动扩容。
- 结构体设计:
typedef struct SeqList { int* a; // 指向堆区动态数组 int size; // 当前有效数据个数(0 ≤ size ≤ capacity) int capacity; // 当前总容量 } SL;
- 核心优势:通过扩容机制(如每次扩容 2 倍),灵活应对数据量变化,避免静态表的 “空间灾难”。
三、动态顺序表的核心操作:从初始化到数据管理
1. 初始化与销毁:搭建 “数据容器”
- 初始化:分配初始空间,初始化容量和数据计数。
typedef CAPACITY 4 //定义初始容量 void SLInit(SL* ps) { ps->a = (int*)malloc(CAPACITY * sizeof(int)); if (ps->a == NULL) { perror("malloc fail"); return; } ps->size = 0; ps->capacity = CAPACITY; }
- 销毁:释放动态数组空间,避免内存泄漏。
void SLDestroy(SL* ps) { free(ps->a); ps->a = NULL; ps->size = ps->capacity = 0; }
2. 扩容机制:应对 “空间不足” 的危机
- 触发条件:当
size == capacity
时,需要扩容。 - 实现逻辑:申请更大的空间(通常是原容量的 2 倍),拷贝数据,释放旧空间。
void SLCheckCapacity(SL* ps) { if (ps->size == ps->capacity) { int new_capacity = ps->capacity * 2; int* new_arr = (int*)realloc(ps->a, new_capacity * sizeof(int)); if (new_arr == NULL) { perror("realloc failed"); return; } ps->a = new_arr; ps->capacity = new_capacity; } }
- 注意:扩容会带来时间开销(数据拷贝),但摊还复杂度仍接近 O (1)。
3. 插入与删除:数据管理的 “核心操作”
(1)按位置插入:头部 / 尾部 / 中间
- 尾部插入(尾插):最简单高效的插入,时间复杂度 O (1)。
void SLPushBack(SL* ps, int x) { SLCheckCapacity(ps); // 先检查扩容 ps->a[ps->size++] = x; // 直接放在末尾 }
- 头部插入(头插):需要将所有元素后移一位,时间复杂度 O (N)。
void SLPushFront(SL* ps, int x) { SLCheckCapacity(ps); // 从最后一个元素开始后移 for (int i = ps->size; i > 0; i--) { ps->a[i] = ps->a[i-1]; } ps->a[0] = x; ps->size++; }
- 指定位置插入:先检查位置合法性,再后移元素。
void SLInsert(SL* ps, int pos, int x) { if (pos < 0 || pos > ps->size) return; // 位置非法 SLCheckCapacity(ps); for (int i = ps->size; i > pos; i--) { ps->a[i] = ps->a[i-1]; } ps->a[pos] = x; ps->size++; }
(2)按位置删除:尾部 / 头部 / 中间
- 尾部删除(尾删):直接减少
size
,无需移动元素,O (1)。void SLPopBack(SL* ps) { if (ps->size == 0) return; // 空表不能删 ps->size--; }
- 头部删除(头删):将后续元素前移一位,O (N)。
void SLPopFront(SL* ps) { if (ps->size == 0) return; for (int i = 0; i < ps->size-1; i++) { ps->a[i] = ps->a[i+1]; } ps->size--; }
- 指定位置删除:前移元素覆盖目标位置。
void SLErase(SL* ps, int pos) { if (pos < 0 || pos >= ps->size) return; for (int i = pos; i < ps->size-1; i++) { ps->a[i] = ps->a[i+1]; } ps->size--; }
4. 查找与修改:快速定位数据
- 按值查找:遍历数组,返回第一个匹配元素的下标,O (N)。
int SLFind(SL* ps, int x) { for (int i = 0; i < ps->size; i++) { if (ps->a[i] == x) return i; } return -1; // 未找到 }
- 按位置访问:直接通过下标访问,O (1),顺序表的最大优势!
int GetElement(SL* ps, int pos) { if (pos < 0 || pos >= ps->size) return -1; // 非法位置 return ps->a[pos]; }
四、顺序表的优缺点:适用场景大揭秘
1. 优点:高效访问,简单易用
- 随机访问 O (1):通过下标直接定位元素,比链表快得多(链表需遍历)。
- 存储密度高:元素连续存储,无需额外指针空间(对比链表每个节点需存储 next 指针)。
- 实现简单:基于数组,逻辑直观,适合入门学习和基础数据管理。
2. 缺点:插入删除低效,扩容有代价
- 中间 / 头部操作 O (N):插入删除需移动大量元素,数据量越大越耗时。
- 空间浪费:动态扩容会预留额外空间(如每次扩 2 倍),可能导致空闲空间浪费。
- 扩容开销:申请新空间、拷贝数据、释放旧空间,涉及 IO 操作,影响性能。
3. 适用场景
- 频繁访问元素:如数组、向量,适合 “查多改少” 的场景(如学生成绩表查询)。
- 数据规模可预估:若已知数据量不会剧烈变化,静态顺序表也能胜任。
- 需要高效存储:无需额外指针空间,适合对内存敏感的场景。
五、实战算法题:顺序表的典型应用
1. 移除元素
- 问题:给定数组
nums
和值val
,原地移除所有val
,返回新长度。 - 思路:双指针法,尾插非
val
元素,避免不必要的移动。 - 顺序表优势:利用连续存储特性,直接操作下标,高效实现。
2. 删除有序数组中的重复项
- 问题:移除有序数组中的重复元素,原地修改,返回新长度。
- 思路:双指针法,快指针遍历,慢指针记录唯一元素位置。
- 顺序表优势:有序性保证,移动元素次数少,时间复杂度 O (N)。
3. 合并两个有序数组
- 问题:将有序数组
nums2
合并到nums1
中,保持有序。 - 思路:从尾部开始倒序比较,避免头部插入的大量移动。
- 顺序表优势:利用数组可扩容特性(需提前分配足够空间),直接操作下标完成合并。
六、总结:顺序表,数据结构的 “实用派”
顺序表是数据结构中 “简单而强大” 的存在:
- 核心价值:基于数组的连续存储,实现高效的随机访问,是入门数据结构的必经之路。
- 适用场景:适合 “读多写少”、数据量可预估或需要高效存储的场景。
- 进阶思考:若需要频繁在中间位置插入删除,链表会更合适;若追求更高性能,可结合现代编程语言的动态数组(如 C++ 的
vector
、Python 的list
,本质都是顺序表封装)。
顺序表以其高效的随机访问和紧凑的内存布局,成为数据处理中的基础工具。尽管存在插入删除效率低、扩容成本高等问题,但其在特定场景(如静态数据、高频访问)中表现优异。理解顺序表的实现与局限,能帮助开发者更合理地选择数据结构,提升程序性能。
附页
//SeqList.h
#pragma once
#include<stdio.h>
#include<stdlib.h>
#include<assert.h>
typedef int SLDataType;
typedef struct SeqList
{
SLDataType* arr;
int size;
int capacity;
}SL;
void SLInit(SL* ps);
void SLPushBack(SL* ps, SLDataType x);
void SLPushFront(SL* ps, SLDataType x);
void SLPopBack(SL* ps);
void SLPopFront(SL* ps);
int SLFind(SL* ps, SLDataType x);
void SLInsert(SL* ps, SLDataType x,int pos);
void SLErase(SL* ps, int pos);
void SLDesTroy(SL* ps);
//SeqList.c
#include"SeqList.h"
void SLCheckCapacity(SL* ps)
{
if (ps->size == ps->capacity)
{
int newcapacity = ps->capacity == 0 ? 4 : 2 * ps->capacity;
SLDataType* tmp = (SLDataType*)realloc(ps->arr, newcapacity * sizeof(SLDataType));
if (tmp == NULL)
{
printf("realloc fail");
exit(1);
}
ps->arr = tmp;
ps->capacity = newcapacity;
}
}
void SLInit(SL* ps)
{
ps->arr = NULL;
ps->size = ps->capacity = 0;
}
void SLPushBack(SL* ps, SLDataType x)
{
assert(ps);
SLCheckCapacity(ps);
ps->arr[ps->size++] = x;
}
void SLPushFront(SL* ps, SLDataType x)
{
assert(ps);
SLCheckCapacity(ps);
for (int i = ps->size; i > 0; i--)
{
ps->arr[i] = ps->arr[i - 1];
}
ps->arr[0] = x;
++ps->size;
}
void SLPopBack(SL* ps)
{
assert(ps && ps->size);
--ps->size;
}
void SLPopFront(SL* ps)
{
assert(ps && ps->size);
for (int i = 0; i < ps->size - 1; i++)
{
ps->arr[i] = ps->arr[i + 1];
}
--ps->size;
}
int SLFind(SL* ps, SLDataType x)
{
for (int i = 0; i < ps->size; i++)
{
if (ps->arr[i] == x)
{
return 1;
}
}
return 0;
}
void SLInsert(SL* ps, SLDataType x, int pos)
{
assert(ps && (pos <= ps->size) && (pos >= 0));
SLCheckCapacity(ps);
for (int i = ps->size; i > pos; i--)
{
ps->arr[i] = ps->arr[i - 1];
}
ps->arr[pos] = x;
++ps->size;
}
void SLErase(SL* ps, int pos)
{
assert(ps && ps->size && (pos < ps->size) && (pos >= 0));
for (int i = pos; i < ps->size-1; i++)
{
ps->arr[i] = ps->arr[i + 1];
}
--ps->size;
}
void SLDesTroy(SL* ps)
{
if (ps->arr)
free(ps->arr);
ps->arr = NULL;
ps->size = ps->capacity = 0;
}