中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

使用PHP怎么獲取中英混合字符串的長度

發布時間:2020-12-30 15:13:18 來源:億速云 閱讀:207 作者:Leah 欄目:開發技術

使用PHP怎么獲取中英混合字符串的長度?針對這個問題,這篇文章詳細介紹了相對應的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。

 代碼如下:


$str = 'Hello world!';
echo strlen($str); // 輸出12


然而在PHP自帶的函數中,strlen及mb_strlen都是通過計算字符串所占字節數來計算長度的,在不同的編碼情況下,中文所占的字節數是不同的。在GBK/GB2312下,中文字符占2個字節,而在UTF-8下,中文字符占3個字節。

復制代碼 代碼如下:


$str = '你好,世界!';
echo strlen($str); // GBK或GB2312下輸出12,UTF-8下輸出18


而我們在判斷字符串長度時往往需要判斷的是字符的數量,而非字符串所占字節數,如在UTF-8下的這段PHP代碼:

復制代碼 代碼如下:


$name = '張耕暢';
$len = strlen($name);
// 輸出 FALSE,因為在UTF-8下三個中文占9個字節
if($len >= 3 && $len <= 8){
 echo 'TRUE';
}else{
 echo 'FALSE';
}


那么有什么方便而實用的方法可以獲得含中文字符串的長度呢?可以用正則計算出中文字符的個數,在GBK/GB2312編碼下除以2,UTF-8編碼下則除以3,最后再加上非中文字符串的長度,但這樣未免太過麻煩。

WordPress這么一段代碼,借鑒如下:

復制代碼 代碼如下:


$str = 'Hello,世界!';
preg_match_all('/./us', $str, $match);
echo count($match[0]); // 輸出9


思想是用正則表達式將字符串分割成單個字符,并直接用count計算出匹配到的字符數,便是我們想要的結果了。

但以上代碼在UTF-8編碼下并不能處理GBK/GB2312的中文字符串,因為GBK/GB2312的中文字符會被識別為兩個字符而計算出來的中文字符數量會翻倍,于是我想到了這么一個辦法:

復制代碼 代碼如下:


$tmp = @iconv('gbk', 'utf-8', $str);
if(!empty($tmp)){
 $str = $tmp;
}
preg_match_all('/./us', $str, $match);
echo count($match[0]);


可兼容GBK/GB2312及UTF-8編碼,經小量數據測試通過,但暫未確定是否完全正確,盼有大牛指點一二。

以上本意是為了框架可以兼容多種編碼格式,但一般在日常開發中,一個項目是已經可以確定為何種編碼的,因此可以使用以下函數來方便地獲取字符串長度:

復制代碼 代碼如下:


int iconv_strlen ( string $str [, string $charset = ini_get("iconv.internal_encoding") ] )

關于使用PHP怎么獲取中英混合字符串的長度問題的解答就分享到這里了,希望以上內容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關注億速云行業資訊頻道了解更多相關知識。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

绥宁县| 平原县| 铅山县| 天镇县| 博兴县| 徐水县| 台湾省| 开远市| 天峨县| 黑河市| 青海省| 雷州市| 台北市| 永丰县| 哈巴河县| 靖安县| 丹寨县| 许昌市| 鄂伦春自治旗| 江阴市| 曲阜市| 张北县| 新民市| 临湘市| 潞西市| 民乐县| 五寨县| 盘锦市| 浦东新区| 辽源市| 曲阳县| 乌苏市| 定兴县| 城步| 凤山县| 响水县| 龙胜| 中方县| 淮安市| 台湾省| 吉安县|