C++的string.substr
函數是用來截取子字符串的,包括英文字符和中文字符。可以通過指定起始位置和長度來截取指定長度的字符。但需要注意的是,中文字符在C++中是以多個字節表示的,所以在截取中文字符時要確保起始位置和長度是正確的。
如果要截取中文字符,可以先將字符串轉換為wstring
類型,然后再使用wstring
的substr
函數來截取中文字符。示例代碼如下:
#include <iostream>
#include <string>
#include <codecvt>
int main() {
std::string utf8str = "中文字符測試";
std::wstring_convert<std::codecvt_utf8<wchar_t>> converter;
std::wstring utf16str = converter.from_bytes(utf8str);
std::wstring subStr = utf16str.substr(0, 2); // 從第一個字符開始截取2個字符
std::wstring_convert<std::codecvt_utf8<wchar_t>> utf8converter;
std::string result = utf8converter.to_bytes(subStr);
std::cout << "截取的中文字符為:" << result << std::endl;
return 0;
}
在上面的示例代碼中,首先將UTF-8編碼的字符串轉換為UTF-16編碼的wstring
類型,然后使用substr
函數截取中文字符,最后再將截取的中文字符轉換回UTF-8編碼的字符串輸出。通過這種方式可以正確地截取中文字符。