当前位置: 首页 > news >正文

CD38.【C++ Dev】string类的模拟实现(2)

目录

1.append

测试代码

2.operator+=

string& operator+= (char c)

string& operator+= (const char* s)

测试代码

★3.insert

​编辑

string& insert (size_t pos, size_t n, char c)

​编辑

算法

1.首先要挪动数据,为插入的字符串腾出空间

2.插入n个字符

测试代码

string& insert(size_t pos, const char* s)

测试代码

3.erase

分析

完整代码

测试代码

4.find

size_t find(char c, size_t pos = 0) const

 size_t find(const string& str, size_t pos = 0) const

测试代码

5.substr

拷贝构造函数

substr

测试代码


承接CD37.【C++ Dev】string类的模拟实现(1)文章

1.append

依照STL标准实现,为了简单起见只实现第一个:

append是追加字符串,追加字符串之前先考虑空间够不够:
设追加的C语言风格的字符串的有效长度为len,则追加后字符串的有效长度为_size+len,比较它与_capacity的大小即可,如果大于_capacity,应该至少扩容到_size+len

string& append(const char* str)
{size_t len = strlen(str);if (len + _size > _capacity)reserve(len + _size);memmove(_str + _size, str, len+1);_size += len;return *this;
}

注意:memmove的第3个参数应该为len+1,因为strlen不会将\0计入在内,因此len+1的+1是为\0准备的

测试代码

void test8()
{string str("abc");str.append("defghijklmn");for (char it : str)std::cout << it;return;
}

运行结果:

2.operator+=

依照STL标准实现,为了简单起见只实现其中两个:

string& operator+= (char c)

直接复用push_back的代码:

string& operator+=(char c)
{push_back(c);return *this;
}

string& operator+= (const char* s)

直接复用append代码:

string& operator+=(const char* s)
{append(s);return *this;
}

测试代码

void test9()
{string str("abc");str += 'd';str += "edf";str += 'g';str +="hijklmn";for (char it : str)std::cout << it;return;
}

运行结果:

★3.insert

依照STL标准实现,为了简单起见只实现其中两个:

string& insert (size_t pos, size_t n, char c)

 1.pos必须合法

assert(pos <= _size);

2.插入前需不需要扩容

if (pos + n > _capacity)//注意不是和_size比较reserve(pos + n);//至少扩容到pos + n

扩容后,未插入字符串前:

插入n个字符后:

算法

1.首先要挪动数据,为插入的字符串腾出空间

那么黄色区域的位置为i的元素要挪动到位置i+n,从最后一个字符\0开始挪动,避免覆盖丢失数据,

一共需要移动_size-(pos+1)+1==_size-pos次,即当i==pos时停止移动数据

size_t i = _size;//_str[i]为\0
while (i>=pos)
{_str[i + n] = _str[i];i--;
}
2.插入n个字符

while循环执行结束后,i==pos-1,i需要++变成pos才能复制n个字符,不要忘记修改_size!

//i==pos-1
i++;//之后i==pos
while (i < pos + n)_str[i++] = c;
_size += n;

当然也可以使用memset让代码更简洁

有关memset的用法参见文章:

60.【C语言】内存函数(memset,memcmp函数)

CC8.【C++ Cont】使用memset和memcpy来设置数组

memset(_str + pos, c, n);
_size += n;

错误代码:

string& insert(size_t pos, size_t n, char c)
{assert(pos <= _size);if (pos + n > _capacity)//注意不是和_size比较reserve(pos + n);//至少扩容到pos + nsize_t i = _size;//_str[i]为\0while (i>=pos){_str[i + n] = _str[i];i--;}//i==pos-1i++;//之后i==poswhile (i < pos + n)_str[i++] = c;_size += n;return *this;
}

上方代码有没有问题?

答:有,当pos==0时插入会失败!

 由于i是size_t类型,即无符号整型,取值范围是0~0xFFFFFFFF,当i为0时,循环最后i--,i不会变成-1,而是size_t类型的最大值!

提醒:不能将i定义为int,因为while (i>=pos)在比较时,i为int类型,pos为size_t类型,编译器会首先整型提升:将i转化为size_t类型(范围小的提升到范围大的),会导致i==-1仍然在循环

解决方法1:强制类型转换,改成while (i>=(int)pos)

解决方法2:while循环的条件需要多加一个i!=string::npos

注:STL库中npos是静态变量,定义为-1

注意静态变量需要在类中声明,在类外定义,用const修饰

//......	const static size_t npos;};const size_t string::npos = -1;
}

正确代码:

string& insert(size_t pos, size_t n, char c)
{assert(pos <= _size);if (pos + n > _capacity)//注意不是和_size比较reserve(pos + n);//至少扩容到pos + nsize_t i = _size;//_str[i]为\0while (i>=pos&&i!=npos){_str[i + n] = _str[i];i--;}memset(_str + pos, c, n);_size += n;return *this;
}

测试代码

void test10()
{string str("abc");str.insert(3, 5, 'x');for (char it : str)std::cout << it;std::cout << std::endl;str.insert(2, 5, 'y');for (char it : str)std::cout << it;return;
}

运行结果:

string& insert(size_t pos, const char* s)

把上方代码的n定义为strlen(s),同时把memset改成memmove(_str+pos,s, n);

string& insert(size_t pos, const char* s)
{size_t n = strlen(s);assert(pos <= _size);if (pos + n > _size){reserve(pos + n);}size_t i = _size;//_str[i]为\0while (i >= pos&&i!=npos){_str[i + n] = _str[i];i--;}memmove(_str+pos,s, n);_size += n;return *this;
}

测试代码

void test11()
{string str("abc");str.insert(1, "def");for (char it : str)std::cout << it;std::cout << std::endl;str.insert(4, "ghi");for (char it : str)std::cout << it;return;
}

运行结果:

3.erase

分析

依照STL标准实现,为了简单起见只实现其中一个:

发现第二个参数是缺省参数,调用者如果没有给第二个参数,会默认删到最后

首先pos的取值必须合法,因此先判断筛去不合理的情况:

assert(pos <= _size);

满足pos<=_size的几种情况:

1.pos<_size

 

这3种情况只需要用\0修改并修改_size:

if (pos + len >= _size)
{_str[pos] = '\0';_size = pos;
}

上面这样写有没有问题?

答:有,当len == npos时会出问题,因为npos是size_t类型的最大值,根据size_t的回绕性或者称为截断特性,pos+len可以小于_size

回绕性(截断特性)的证明:

int main()
{size_t val = 0xFFFFFFFF;val++;return 0;
}

单步调试,看看val在内存中的值:

 pos+len可以小于_size的原因:

举例:pos==2,len==npos,_size==5,此时pos+len==1<5

需要改成:

if (len == npos || pos + len >= _size)
{_str[pos] = '\0';_size = pos;
}
else
{//pos + len < _size
}

注:依据||的短路原理,len == npos必须先判断!

2.pos==_size

此时len无论取何值,都没有字符需要删除

pos + len < _size的代码:

size_t i = pos + len;
while (i < _size)_str[pos++] = _str[i++];
_str[pos + len] = '\0';
_size -= len;

完整代码

string& erase(size_t pos = 0, size_t len = npos)
{assert(pos <= _size);if (len == npos || pos + len >= _size){_str[pos] = '\0';_size = pos;}else{size_t i = pos + len;while (i < _size)_str[pos++] = _str[i++];_str[pos + len] = '\0';_size -= len;}return *this;
}

测试代码

void test12()
{string str1("teststring1");string str2("teststring2");str1.erase(4);str2.erase(3,3);for (char it : str1)std::cout << it;std::cout << std::endl;for (char it : str2)std::cout << it;return;
}

运行结果:

4.find

依照STL标准实现,为了简单起见只实现其中两个:

注意到最后都写了const,因为find没有修改字符串

size_t find(char c, size_t pos = 0) const

注意pos要合法

size_t find(char c, size_t pos = 0) const
{assert(pos < _size);for (size_t i = pos; i < _size; i++)if (_str[i] == c)return i;return npos;
}

 size_t find(const string& str, size_t pos = 0) const

作用:查找子字符串

可以直接调用strstr函数,对其返回值作不同处理即可

由于strstr只接收char*或const char*型的参数,str需要取它的C语言类型的字符串,使用c_str函数,注意pos要合法

size_t find(const string& str, size_t pos = 0) const
{assert(pos < _size);const char* ret_ptr = strstr(_str, str.c_str());if (ret_ptr == nullptr)return npos;return ret_ptr - _str;
}

测试代码

void test13()
{string str("teststring");std::cout << str.find('s', 1) << std::endl;std::cout << str.find("str", 1) << std::endl;std::cout << str.find("abc", 4) << std::endl;return;
}

运行结果:

5.substr

依照STL标准实现,注意到最后写了const,因为substr没有修改字符串 

pos要合法,首先断言,按照erase函数分类讨论的思想写substr,由于返回类型为string,因此程序会自动调用拷贝构造函数,那么这里先写拷贝构造函数

拷贝构造函数

代码

string(const string& str)
{_capacity = str._capacity;_size = str._size;_str = new char[_capacity + 1];memmove(_str, str._str, _capacity + 1);
}

注意: 1.正确设置几个参数,使用memmove更方便,但不能使用strcpy, 2.一定不能使用默认的拷贝构造函数,浅拷贝,局部对象一出作用域就销毁了,会出问题,

substr

代码

string substr(size_t pos = 0, size_t len = npos) const
{assert(pos < _size);string ret;ret._size = len;if (len == npos || pos + len >= _size)//从pos处截取到末尾ret._size = _size - pos;ret.reserve(ret._size);memmove(ret._str, _str + pos, ret._size);if (ret._str[ret._size] != '\0')ret._str[ret._size] = '\0';return ret;
}

注意memove截取的字符串很有可能没有\0,因此需要判断,如果没有就在ret._str[ret._size]上补\0,成为有效字符串

测试代码

void test14()
{string str("teststring");string ret1 = str.substr(4);string ret2 = str.substr();string ret3 = str.substr(2,3);for (char it : ret1)std::cout << it;std::cout << std::endl;for (char it : ret2)std::cout << it;std::cout << std::endl;for (char it : ret3)std::cout << it;return;
}

执行结果:

相关文章:

  • 深入理解卷积神经网络:从基础原理到实战应用
  • 2025年道路运输安全员考试题库及答案
  • vulnhub靶场——secarmy
  • Python知识框架
  • SSH秘钥配置介绍
  • 44、私有程序集与共享程序集有什么区别?
  • 怎么实现Redis的高可用?
  • GraphPad Prism简介、安装与工作界面
  • 【CUDA】Sgemm单精度矩阵乘法(下)
  • 使用mermaid 语言绘画时序图和链路图
  • 编程日志5.5
  • 计算机网络:怎么理解调制解调器的数字调制技术?
  • SDIO EMMC中ADMA和SDMA简介
  • Ansible Roles 是一种用于层次化和结构化组织 Ansible Playbook 的机制。
  • [已解决] VS Code / Cursor / Trae 的 PowerShell 终端 conda activate 进不去环境的常见问题
  • Windows 环境下安装 Node 和 npm
  • 【Pandas】pandas DataFrame describe
  • Java 大视界 -- 基于 Java 的大数据分布式存储在工业互联网海量设备数据长期存储中的应用优化(248)
  • vscode - 笔记
  • 采用均线策略来跟踪和投资基金
  • 商务部新闻发言人就出口管制管控名单答记者问
  • “大鼻子情圣”德帕迪约因性侵被判缓刑,还有新的官司等着他
  • 首个偏头痛急性治疗药物可缓解前期症状
  • “水运江苏”“航运浙江”,江浙两省为何都在发力内河航运?
  • 牛市早报|中美日内瓦经贸会谈联合声明公布
  • 珠峰窗口期5月开启 普通人登一次有多烧钱?