C++string类详解
目录
1.string类的介绍
2.string的常见接口函数
3.string浅拷贝问题
4.string模拟实现
1.string类的介绍
C语言中,字符串是以'\0'结尾的一些字符的集合,为了操作方便,C标准库中提供了一些str系列的库函数,但是这些库函数与字符串是分离开的,不太符合OOP的思想,而且底层空间需要用户自己管理,稍不留神可能还会越界访问。
在OJ中,有关字符串的题目基本以string类的形式出现,而且在常规工作中,为了简单、方便、快捷,基本都使用string类,很少有人去使用C库中的字符串操作函数。
在使用string类时,必须包含#include<string.h>以及using namespace std;
2.string的常见接口函数
<string> - C++ Reference
对象的常见构造有1(空字符串),2(用给定的char数组初始化),4(用已经初始化的字符串初始化)
string s1;//构造空字符串
string s2("hello world");
string s3(s2);//拷贝构造s3
常见的容量操作有size,empty,reserve(开空间),resize(开空间+填值初始化)
1. size()与length()方法底层实现原理完全相同,引入size()的原因是为了与其他容器的接口保持一
致,一般情况下基本都是用size()。
2. clear()只是将string中有效字符清空,不改变底层空间大小。
3. resize(size_t n) 与 resize(size_t n, char c)都是将字符串中有效字符个数改变到n个,不同的是当字符个数增多时:resize(n)用0来填充多出的元素空间,resize(size_t n, char c)用字符c来填充多出的元素空间。
注意:resize在改变元素个数时,如果是将元素个数增多,可能会改变底层容量的大
小,如果是将元素个数减少,底层空间总大小不变。
4. reserve(size_t res_arg=0):为string预留空间,不改变有效元素个数,当reserve的参数小于
string的底层空间总大小时,reserve不会改变容量大小。
常见的访问对象的操作:[]访问,迭代器访问(任何容器),范围for
operator[](类似于数组对下标的访问)最常用
begin获取string第一个字符的迭代器,end获取最后一个字符的下一个位置(\0)迭代器
rbegin获取最后一个字符的迭代器,rend获取第一个字符的前一个位置的迭代器
范围for,底层实现是迭代器,具体操作取string中每一个字符赋值给临时变量。
举上述三个例子更好理解,实现遍历字符串输出内容:
string s1("hello!");
for(int i=0;i<s1.size();i++)
{
cout<<s1[i]<<" ";
}
string::iterator it=s1.begin();
while(it!=end())
{
cout<<*it<<" ";
++it;
}
for(auto e:s1)
{
cout<<e<<"";
}
常见的修改操作:push_back(在字符串后尾插字符)append和operator+=(在字符串后追加字符串),c_str,find+npos
string s;
s.push_back('a');//s+='a';
s.append("bc");//s+="bc";
用find分离网址:协议+域名+资源名
3.string浅拷贝问题:
看以下代码有什么问题
/*String()
:_str(new char[1])
{*_str = '\0';}
*/
//String(const char* str = "\0") 错误示范
//String(const char* str = nullptr) 错误示范
String(const char* str = "")
{
if (nullptr == str)
{
assert(false);
return;
}
_str = new char[strlen(str) + 1];
strcpy(_str, str);
}
~String()
{
if (_str)
{
delete[] _str;
_str = nullptr;
}
}
private:
char* _str;
};
// 测试
void TestString()
{
String s1("hello bit!!!");
String s2(s1);
}
上述String类没有显式定义其拷贝构造函数与赋值运算符重载,此时编译器会合成默认的,当用s1构造s2时,编译器会调用默认的拷贝构造。最终导致的问题是,s1、s2共用同一块内存空间,在释放时同一块空间被释放多次而引起程序崩溃,这种拷贝方式,称为浅拷贝。
引用计数:用来记录资源使用者的个数。在构造时,将资源的计数给成1,每增加一个对象使用该资源,就给计数增加1,当某个对象被销毁时,先给该计数减1,然后再检查是否需要释放资源,如果计数为1,说明该对象时资源的最后一个使用者,将该资源释放;否则就不能释放,因为还有其他对象在使用该资源。
应对方法:
1.构造了两个对象,会对同一个空间析构两次 - >引用计数
2.其中一个对象改变会影响另一个 - >写的时候只要引用计数不是1,就深拷贝
4.string模拟实现
1.string区别于char数组最大的特点是末尾会有一个\0。初始化,插入,删除数据的时候不要忘记添加。
2.不能使用strcpy,strcmp等函数来拷贝原string的数据,他们遇到\0会停止。防止特殊字符串中间含\0,没有读取到后续的字符串。应该用memcpy,memcmp代替。
3.重载>>时,为了避免浪费空间,选择一直在buff数组上存储数据,防止空间开的过大或过小。
#pragma once
#include<iostream>
#include<assert.h>
using namespace std;
namespace bit
{class string{friend ostream& operator<<(ostream& _cout, const bit::string& s);friend istream& operator>>(istream& _cin, bit::string& s);public:typedef char* iterator;public:string(const char* str):_str(new char[strlen(str) + 1]), _capacity(strlen(str)), _size(strlen(str)){memcpy(_str, str, _size + 1);std::cout << "string(const char* str = "")"<<endl;};string(const string& s){_str = new char[s._capacity + 1];_capacity = s._capacity;_size = s._size;memcpy(_str, s._str, _size + 1);std::cout << "string(const string & s)"<<endl;};string():_str(new char[1]),_capacity(0),_size(0){_str[0] = '\0';std::cout << " string()"<<endl;}//string& operator=(const string& s)//{// if (this != &s)// {// char*tmp= new char[s._capacity + 1];// memcpy(tmp, s._str, _size + 1);// delete[] _str;// _str = tmp;// _capacity = s._capacity;// _size = s._size;// // }// return *this;//};void Swap(string& s){std::swap(_str, s._str);std::swap(_capacity, s._capacity);std::swap(_size, s._size);}string& operator=(string s){Swap(s);return *this;}~string(){delete[] _str;_capacity = _size = 0;std::cout << "~string()"<<endl;};////////////////////////////////////////////////////////////////// iteratoriterator begin(){return _str;};iterator end(){return _str + _size;};const iterator begin() const{return _str;}const iterator end() const{return _str + _size;}// /////////////////////////////////////////////////////////////// // modifyvoid push_back(char c){if (_capacity == _size){reserve(_capacity == 0 ? 4 : 2 * _capacity);}_str[_size] = c;_size++;_str[_size] = '\0';};string& operator+=(char c){push_back(c);return *this;}void append(const char* str){int len = strlen(str);if (len + _size > _capacity){reserve(len + _size);}memcpy(_str + _size, str, len + 1);_size += len;}string& operator+=(const char* str){append(str);return *this;}void clear(){_str[0] = '\0';_size = 0;}/////////////////////////////////////////////////////////////////// capacityconst char* c_str() const{return _str;}size_t size()const{return _size;}size_t capacity()const{return _capacity;}bool empty()const{return _size == 0;}void resize(size_t n, char c = '\0'){if (_capacity >= n){_size = n;_str[_size] = '\0';}else{reserve(n);for (int i = _size; i < n; i++){_str[i] = c;}_size = n;_str[n] = '\0';}};void reserve(size_t n){if (_capacity < n){char* tmp = new char[n+1];memcpy(tmp, _str, _size + 1);delete[]_str;_str = tmp;_capacity = n;}cout << _capacity << endl;}/////////////////////////////////////////////////////////////////// accesschar& operator[](size_t pos){assert(pos < _size);return _str[pos];};const char& operator[](size_t pos)const{assert(pos < _size);return _str[pos];};///////////////////////////////////////////////////////////////////relational operatorsbool operator==(const string& s){return (_size == s._size) && (memcmp(_str, s._str, _size) == 0);};bool operator<(const string& s){int ret=memcmp(_str, s._str, min(_size, s._size));return ret == 0 ? _size < s._size : ret < 0;}bool operator<=(const string& s){return *this == s || *this < s;}bool operator>(const string& s){return !(*this <= s);}bool operator>=(const string& s){return !(*this < s);}bool operator!=(const string& s){return !(*this == s);}// 返回c在string中第一次出现的位置size_t find(char c, size_t pos = 0) const{assert(pos < _size);for (size_t i=pos; i < _size; i++){if (_str[i] == c)return i;}return -1;}// 返回子串s在string中第一次出现的位置size_t find(const char* s, size_t pos = 0) const{assert(pos < _size);const char* tmp = strstr(_str, s);if (tmp){return tmp - _str;}return -1;}// 在pos位置上插入字符c/字符串str,并返回该字符的位置string& insert(size_t pos, char c){assert(pos <= _size);if(_capacity==_size)reserve(_size + 1);_size++;for (size_t i = _size; i >= pos + 1; i--){_str[i] = _str[i - 1];}_str[pos] = c;return *this;}string& insert(size_t pos, const char* str){assert(pos <= _size);size_t len = strlen(str);if (_capacity < _size + len){reserve(_size + len);}_size += len;for (size_t i = _size; i >=pos+len; i--){_str[i] = _str[i - len];}memcpy(_str + pos, str, len);return *this;}string& erase(size_t pos, size_t len){assert(pos < _size);if (len==-1||pos + len > _size){_str[pos] = '\0';_size = pos;}else {for (size_t i = pos; i <_size-len; i++){_str[i] = _str[i + len];}_size -= len;_str[_size] = '\0';}return *this;}private:char* _str;size_t _capacity;size_t _size;};ostream& operator<<(ostream& _cout, const bit::string& s){for (auto ch : s){_cout << ch;}return _cout;}istream& operator>>(istream& _cin, bit::string& s){s.clear();//清除上一次读取的数据char ch = _cin.get();// 处理前缓冲区前面的空格或者换行while (ch == ' ' || ch == '\n'){ch = _cin.get();//不处理,get自动会跳过之前的空格和换行}char buff[128] = { 0 };int i = 0;while (ch != ' ' && ch != '\n'){buff[i++] = ch;if (i == 127){buff[i] = '\0';s += buff;i = 0;}ch = _cin.get();}//当缓冲区满 127 个字符时,就把内容追加到结果字符串if (i != 0){buff[i] = '\0';s += buff;}return _cin;}
};