当前位置: 首页 > news >正文

数据结构——串

串是一种数据元素为字符的特殊的线性表。

1. 串的定义

零个或多个字符(字母、数字或其他字符)组成的有限序列。记为 S="a1a2...an"S="a1​a2​...an​",长度为 nn,空串长度为0。

2.串的术语

  • 串长度:串中字符的个数。
  •  空串:零个字符的串。即:"",通常用φ表示。
  • 字符位置:字符在序列中的序号。
  • 空格串:由一个或多个空格组成的串。
  • 子串:串中任意个连续的字符组成的子序列。
  • 主串:包含子串的串。
  • 子串位置:子串的第一个字符在主串中的位置。
  • 串相等:两个串的值相等,即两个串的长度相等,各个对应位置的字符都相等。

3.串的基本运算

  • strassign (s, chars)               //串赋值
  • strCompare (S,T)                  //串比较
  • strLength(S)                          //求串长
  • concat(T, S1, S2)                  //串联接
  • subString(S, sub, pos, len)   //求子串
  • strCopy(T, S)                         //串拷贝
  • strEmpty(S)                           //串判空
  • clearString (S)                       //清空串
  • index(S, T, pos)                     //子串的位置
  • replace(S, T, V)                     //串替换
  • strInsert(S, pos, T)                //子串插入
  • strDelete(S, pos, len)            //子串删除

4. 串的存储结构

 

  • 顺序存储:使用数组存储字符,末尾可加结束符(如C的\0)。优点:随机访问高效;缺点:插入/删除需移动元素。

  • 链式存储:每个节点存储一个或多个字符,通过指针链接。优点:动态扩展方便;缺点:空间利用率低,操作复杂。

5. 模式匹配算法

(1)暴力匹配(Brute-Force)

  • 过程:主串指针i和模式串指针j逐个比较,失败时i回溯到i-j+1j重置为0。

  • 时间复杂度:O(mn)O(mn)。

(2)KMP算法

  • 核心思想:利用部分匹配信息(最长公共前后缀),避免主串回溯。

  • 步骤

        构造next数组:记录模式串每个位置的最长公共前后缀长度。

        匹配过程:主串指针i不回溯,模式串指针j根据next数组跳转。

  • next数组构造

    void  getnext( SqString T, int next[ ] )
    {      int j,  k;
            next[0] = -1; 
            j = 0;   k = -1;      //k=next[j]
           while( j < T.length-1 )
           {      if ( k == -1 || T.str[j] == T.str[k] )  
                  {     next[j+1] =  k+1;
                         j++;
                         k++;    //k=next[j]
                  } 
                  else    k = next[k]
           }       
    }
    
    
  • 时间复杂度:O(m+n)O(m+n),适用于频繁匹配的场景。

6. 代码示例(KMP算法实现)

 

int  Index_KMP( SqString S, SqString T )
{      int i, j, next[200];
       getnext(T, next);
       i=0; j=0;
       while( i<S.length && j<T. length )
       {     if( j == -1|| S.str[i] ==T.str[j] )
              {    i++; j++; 
              }
              else  j = next[j];
       }
       if(j>=T.length)  return i-T.curlen+1; //返回位序  
       else return 0;
}

总结

串是数据处理的基础结构,其高效操作依赖于合理的存储设计和算法选择。掌握KMP算法及其next数组的构造是解决复杂字符串匹配问题的关键。实际应用中需结合场景权衡不同方法的优缺点。

 

相关文章:

  • Java 大视界 -- Java 大数据中的数据隐私保护技术在多方数据协作中的应用(147)
  • B树和 B+树
  • 如何实现单点登录?
  • 【js逆向入门】图灵爬虫练习平台 第九题
  • Linux进程控制(四)之进程程序替换
  • Spring Boot02(数据库、Redis)02---java八股
  • HTML网页代码预览器
  • 【Linux】Ubuntu 24.04 LTS 安装 Hadoop-3.4.1
  • TCP | 序列号和确认号 [逐包分析] | seq / ack 详解
  • 视频播放器(watermelon Player)vue2使用体验(教程版)
  • Android Compose 框架按钮与交互组件模块源码深度剖析(二)
  • windows清除电脑开机密码,可保留原本的系统和资料,不重装系统
  • others-rustdesk远程
  • 带你从入门到精通——自然语言处理(十. BERT)
  • LeetCode hot 100 每日一题(13)——73. 矩阵置零
  • ubuntu22.04安装搜狗输入法保姆教程~
  • 《虚拟战场的对决》
  • DeepSeek R1 本地部署指南 (3) - 更换本地部署模型 Windows/macOS 通用
  • 通俗易懂搞懂@RequestParam 和 @RequestBody
  • 【LetMeFly】牛客-美团暑期2025-20250322-前两题和第三题的思路
  • 17家A股城商行一季报扫描:青岛银行营收增速领跑,杭州银行净利增速领跑
  • 新势力4月销量出炉:零跑逾4万辆再夺冠,蔚来环比增近六成,小米下滑
  • 美国经济萎缩意味着什么?关税政策如何反噬经济?
  • 内蒙古公开宣判144件毁林毁草刑案,单起非法占用林地逾250亩
  • 奔驰一季度利润降四成,受美国加征关税影响放弃全年盈利展望
  • 神十九乘组安全顺利出舱