> 技术文档 > C++之string类的实现代码及其详解(下)

C++之string类的实现代码及其详解(下)

 我们在使用C++STL库里面的string的时候,我们可以直接通过运算符来进行大于,小于或者各类运算,这个便是我们在string这个类里面对运算符进行了重载,使它有了新的意思。

 1. operator[]

以下这个代码是类的下标运算符重载。这个函数允许对象像数组一样使用方括号[]来访问其内部字符元素,并返回指定位置字符的引用。

就比如说pos等于3,就是把这个_str里面第三个给取出来。举个例子,现在有一个string s1,

然后s1[3]就是把s1里面从前往后数第三个字符给return。我们可以把重载后的[]当做一个函数。  

char& operator[](size_t pos){assert(pos < _size);return _str[pos];}

2. operator=

这个运算符重载的作用就是实现赋值。

在这里面,这个this叫做this指针,是指向被赋值的对象。举个例子,现在有一个string a,我们对他进行a=b的操作,那么这个this就是指向a的。

我们通过this指针来判断被赋值的对象(a)和赋值对象(b)是否相等,如果已经相等那就没有判断的必要,如果进入if里面的话就先开辟一个b大小的空间,然后把b里面的东西复制进入这个空间里面并销毁a里面原先空间的内容,然后把新开辟的内存全部叫给a,从而实现赋值。

PS:各位看到这里不知道有没有去想一想为什么不可以直接让a指向b不就好了吗?这是因为这种方法叫做浅拷贝,而浅拷贝会触发两个问题。第一就是我们在改变a或b的时候会让另一个也被改变。第二就是我们在delete的时候会对同一个空间析构两次。

string& operator=(const string& s){if (this != &s){char* tmp = new char[s._capacity + 1];memcpy(tmp, s._str, s._size + 1);delete[] _str;_str = tmp;_size = s._size;_capacity = s._capacity;}return *this;}

3. operator+=

这个加等我们可以把他理解为push_back。可能有人会想明明有push_back了为什么还要这个+=呢?其实就是为了更方便的去编写代码。

这个没什么好说的,就是先push_back然后返回被添加对象的开头位置。

string& operator+=(char ch){push_back(ch);return *this;}

这个的话就是添加字符串的时候用的,加上const是因为const char* str表示指针指向的字符串内容不能被修改。因为operator+=的功能是“把str追加到当前字符串后”,而不是修改str本身,加const可以防止函数内部意外修改str的内容,也能接收const类型的字符串(比如字面量\"abc\",它本身就是const char*类型)。

如果参数不带const(即char* str),那么当传入一个常量字符串(如\"test\")时,会因为类型不匹配(const char*无法隐式转换为char*)而编译报错。所以带const是更通用、更安全的设计。

string& operator+=(const char* str){append(str);return *this;}

4.  operator<

这个的话就是比较两个string类的大小,如果是符合小于的话就会返回true,否则返回false。

PS:string大小是按字符的ASCII值逐个比较

    1.    从两个字符串的第一个字符开始,依次对比对应位置的字符。

    2.    当遇到第一对不相等的字符时,直接根据这两个字符的ASCII值判断大小:ASCII值小的字符所在的字符串更小。

    3.    如果所有字符都相同,则较短的字符串更小;若长度也相同,则两个字符串相等(返回false)。

例如:

    •    \"apple\" < \"banana\":第一个字符\'a\'(ASCII 97) < \'b\'(ASCII 98),所以前者更小。

    •    \"app\" < \"apple\":前3个字符相同,前者长度更短,所以更小。

这个函数逐字符比较当前字符串(this)与参数字符串s:首先同步遍历两个字符串的每个字符,若发现不同字符,则根据该字符的 ASCII 值判断大小并立即返回结果;若所有已遍历字符均相同,则在循环结束后比较剩余长度,若当前字符串先结束(更短)则返回true,否则返回false。例如,比较\"abc\"\"abd\"时,会在第三个字符处因\'c\' < \'d\'返回true;比较\"abc\"\"abcd\"时,循环结束后因当前字符串更短而返回true

bool operator<(const string& s) const{size_t i1 = 0;size_t i2 = 0;while (i1 < _size && i2 < s._size){if (_str[i1]  s._str[i2]){return false;}else{++i1;++i2;}} if (i1 == _size && i2 != s._size){ return true;}else{return false;}}

5.  operator==

这个函数就是判断两个string类是否是否相等,如果相等就返回true,否则返回false。

我们在这里通过逻辑运算符,比较两个size是否相等和memcpy是否成功(成功返回0)来直接判断。

bool operator==(const string& s) const{return _size == s._size &&memcmp(_str, s._str, _size) == 0;}

6. operator<= 

这个的话就是比较两个string类的大小,如果是符合小于等于的话就会返回true,否则返回false。

因为我们已经实现了<和==,所以我们在这里直接

7. operator> 

这个的话就是比较两个string类的大小,如果是符合大于的话就会返回true,否则返回false。

这边也是,因为不是小于等于就是大于。

bool operator>(const string& s) const{return !(*this <= s);}

8. operator>=

这个的话就是比较两个string类的大小,如果是符合大于的话就会返回true,否则返回false。

这个也是一样的道理,对小于取反就可以了。

bool operator >=(const string& s) const{return !(*this < s);}

9. operator<<

这段代码定义了一个针对 struggle::string 类型的输出流运算符重载函数。它允许使用 << 运算符将 struggle::string 对象直接输出到标准输出流(如 cout)或其他输出流中。

函数遍历 s 中的每个字符,依次将其写入输出流 out,最后返回流的引用以支持链式输出(如 cout << s1 << s2)。这种实现方式假设 struggle::string 是一个类似标准库 std::string 的自定义字符串类,支持范围 - based for 循环(即提供了迭代器接口)。

PS:std是因为ostreamoperator<<的输出流相关功能属于 C++ 标准库的命名空间stdostream是所有输出流类型的基类,所以在这里写的是这个。

std::ostream& operator<<(std::ostream& out, const struggle::string& s){for (auto ch : s){out << ch;}return out;}

10. operator>>

这个的话就是模拟string的流输入,把内容流入所创建的string类中。

当然我们在一开始要清空原先在里面的内容,然后在读入的同时去掉空格,接着开始重复读入(如果读入满了那就先放入新的string里面然后接着读入)。最后那个if(i != 0)的作用是处理最后一批未填满缓冲区的字符。

std::istream& operator>>(std::istream& in, struggle::string& s){s.clear();char ch = in.get();while (ch == \' \' || ch == \'\\n\'){ch = in.get();}char buff[256];int i = 0;while (ch != \' \' && ch != \'\\n\'){buff[i++] = ch;if (i == 255){buff[i] = \'\\0\';s += buff;i = 0;}ch = in.get();}if (i != 0){buff[i] = \'\\0\';s += buff;}return in;}

11. 总结 

到这里我们的string就基本上讲完了,运算符重载让字符串操作更直观;而push_back等接口函数则从底层支撑起字符添加、长度管理等基础功能。两者结合,既保证了使用的便捷性,又通过内存安全处理,实现了一个可靠的字符串类,也深化了对类封装与内存管理的理解。以下是string的完整代码。

#pragma once#define _CRT_SECURE_NO_WARNINGS 1#include#include#includenamespace struggle{class string{public:typedef char* iterator;typedef const char* const_iterator;iterator begin(){return _str;}iterator end(){return _str + _size;}const_iterator begin() const{return _str;}const_iterator end() const{return _str + _size;}string(const char* str = \"\"){_size = strlen(str);_capacity = _size;_str = new char[_capacity + 2];memcpy(_str, str, _size+1);}string(const string& s){_str = new char[s._capacity + 2];memcpy(_str, s._str,s._size+1);_size = s._size;_capacity = s._capacity;}~string(){delete[]_str;_str = nullptr;_size = _capacity = 0;}const char* c_str() const{return _str;}size_t size() const{return _size;}size_t capacity() const{return _capacity;}char& operator[](size_t pos){assert(pos  _capacity){char* tmp = new char[n + 2];memcpy(tmp, _str, _size+1);delete[] _str;_str = tmp;_capacity = n;}}void push_back(char ch){if (_size == _capacity){reserve(_capacity == 0 ? 4 : _capacity * 2);}_str[_size] = ch;++_size;_str[_size] = \'\\0\';}void append(const char* str){size_t len = strlen(str);if (_size + len > _capacity){reserve(_size+len+2);}memcpy(_str + _size, str, len+1);_size += len;}string& operator=(const string& s){if (this != &s){char* tmp = new char[s._capacity + 1];memcpy(tmp, s._str, s._size + 1);delete[] _str;_str = tmp;_size = s._size;_capacity = s._capacity;}return *this;}string& operator+=(char ch){push_back(ch);return *this;}string& operator+=(const char* str){append(str);return *this;}void insert(size_t pos, size_t n, char ch){assert(pos  _capacity){reserve(_size + n + 2);}size_t end = _size;while (end >= pos && end != npos){_str[end + n] = _str[end];--end;}for (size_t i = 0; i < n; ++i){_str[pos+i] = ch;}_size += n;}void insert(size_t pos, const char* str){assert(pos = _capacity){reserve(len + _size + 2);}size_t end = _size;while (end >= pos && end != npos){_str[end + len] = _str[end];--end;}for (size_t i = 0; i < len; ++i){_str[pos + i] = str[i];}_size += len;}void erase(size_t pos, size_t len = npos){assert(pos = _size){_str[pos] = \'\\0\';_size = pos;//_str[_size] = \'\\0\';}else{size_t end = pos + len;while (end <= _size){_str[pos++] = _str[end++];}_size -= len;}}size_t find(char ch, size_t pos = 0){assert(pos <= _size);for (size_t i = pos; i <= _size; ++i){if (_str[i] == ch){return i;}}return npos;}/*size_t find(const char* str, size_t pos = 0){assert(pos <= _size);for (size_t i = pos; i <= _size; ++i){if (_str[i] == str){return i;}}return npos;}}*/string substr1(size_t pos = 0, size_t len = npos){assert(pos  _size){n = _size - pos;}string tmp;tmp.reserve(n);for (size_t i = pos; i < pos + n; ++i){tmp += _str[i];}return tmp;}string substr2(size_t pos = 0, size_t len = npos){assert(pos  _size){n = _size - pos;}string tmp;tmp.reserve(n);for (size_t i = pos; i < pos + n; ++i){for (size_t x = 0; x < n; ++x){tmp[x] = _str[i];}}return tmp;}void resize(size_t n, char ch = \'\\0\'){if (n < _size){_size = n;_str[_size] = \'\\0\';}else{reserve(n);for (size_t i = _size; i < n; i++){_str[i] = ch;}_size = n;_str[_size] = \'\\0\';}}bool operator<(const string& s) const{size_t i1 = 0;size_t i2 = 0;while (i1 < _size && i2 < s._size){if (_str[i1]  s._str[i2]){return false;}else{++i1;++i2;}if (i1 == _size && i2 != s._size){return true;}else{return false;}}}bool operator==(const string& s) const{return _size == s._size &&memcmp(_str, s._str, _size) == 0;}bool operator<=(const string& s) const{return *this (const string& s) const{return !(*this =(const string& s) const{return !(*this < s);}bool operator !=(const string& s) const{return !(*this == s);}void clear(){_size = 0;_str[_size] = \'\\0\';}private:size_t _size;size_t _capacity;char* _str;public:const static size_t npos;};const size_t string::npos = -1;}std::ostream& operator<<(std::ostream& out, const struggle::string& s){for (auto ch : s){out <>(std::istream& in, struggle::string& s){s.clear();char ch = in.get();while (ch == \' \' || ch == \'\\n\'){ch = in.get();}char buff[256];int i = 0;while (ch != \' \' && ch != \'\\n\'){buff[i++] = ch;if (i == 255){buff[i] = \'\\0\';s += buff;i = 0;}ch = in.get();}if (i != 0){buff[i] = \'\\0\';s += buff;}return in;}