中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

PHP如何使用mb_string處理windows中文字符

發布時間:2021-05-27 11:16:11 來源:億速云 閱讀:124 作者:小新 欄目:開發技術

這篇文章給大家分享的是有關PHP如何使用mb_string處理windows中文字符的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。

我們都知道windows中(當然是中文版),文件名和文件內容等編碼都是gbk,而我們在開發過程中,IDE里的編碼則是UTF-8,(這里不討論為什么等等問題,只考慮怎么把編碼轉變成一樣的)所以導致我寫的UTF-8編碼的正則模式字符串中的中文在gbk編碼的文件中并不能正確匹配。

一開始,我并沒有什么辦法,試過把PHP腳本文件的編碼也改成GBK,也可以用,但是想到這種方法太low了,所以找一找PHP中有沒有函數可以滿足我的需求。

這時,我想到了以前在處理windows中的文件名時用的函數iconv(),其函數原型如下:

stringiconv(string$in_charset,string$out_charset,string$str)

Performsacharactersetconversiononthestringstrfromin_charsettoout_charset.

我們常使用:

$out_charset='utf-8';

$fileName=iconv($fileName,$out_charset,'gbk');

來處理文件名,將文件名改從gbk改為UTF-8而內容不變。

手冊翻譯附加:

  • 如果你在輸出字符串$out_charset后面添加//TRANSLIT即$out_charset='utf-8//TRANSLIT',在遇到不能轉換為UTF-8的字符時,程序會自動替換為一個相似字符的UTF-8字符;

  • 如果你在輸出字符串$out_charset后面添加//IGNORE即$out_charset='utf-8//IGNORE',在遇到不能轉換為UTF-8的字符時,程序會自動跳過這個字符。

  • 如果你什么都沒加,就在遇到不能替換成UTF-8的字符時,替換會被中斷。

但是,我在用這個函數處理時,結果卻是這樣:

PHP如何使用mb_string處理windows中文字符

意思是iconv()函數能處理的最大字符數只有64,一般的文件名大小,而我的文件內容很顯然不止64個字符。

沒有辦法,我只好再次各種翻找別的函數。

直到我發現了mb_string函數庫,這個函數庫一般都在PHP環境里集成,我們可以在phpinfo()里找到它。

PHP如何使用mb_string處理windows中文字符

mb_string函數里有一個mb_convert_encoding()函數,可以將一個字符串的編碼改變,其函數原型如下:

stringmb_convert_encoding(string$str,string$to_encoding[,mixed$from_encoding])

Convertsthecharacterencodingofstringstrtoto_encodingfromoptionallyfrom_encoding.

基原型跟iconv()函數差不多,只是它沒有對輸出函數的后綴修飾,它也沒有對字符串長度的明確限制。

而且我們看到$from_encoding是可選的,它可以自動識別源編碼。

因為找不到一個確切的無法轉碼的字符,也不知道它遇到無法轉碼的字符會怎么處理。

通過mb_convert_encoding()函數,將整個文件處理了一下,于是,問題順利解決。

最后介紹一下mb_string函數庫,它全名叫MultibyteString,它的很多方法都擴展自PHP自身的string函數庫,函數名在原函數的前面加了"mb_",這些函數除了擁有原函數的作用外,還在可選參數的最后加入了一個$encoding的可選參數,這個參數可以規定函數以什么樣的編碼方式來處理字符串。

例如strpos()函數,找到一個字符串在另一個字符串中的位置。

strpos("歡迎來訪問","問",0)返回的結果是12,因為腳本是UTF-8編碼,而將字符串轉為UTF-8編碼后,每個中文字符會占用3個字節。

而在mb_strpos()函數中,mb_strpos("歡迎來訪問","問",0,'utf-8')則會返回4,它會將字符串當作已經轉UTF-8的狀態執行。

而mb_strpos("歡迎來訪問","問",0,'gbk')會返回6

感謝各位的閱讀!關于“PHP如何使用mb_string處理windows中文字符”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

php
AI

疏勒县| 边坝县| 咸丰县| 博兴县| 贺兰县| 辛集市| 伊宁市| 沂源县| 福清市| 上犹县| 化隆| 旬邑县| 叶城县| 延边| 高密市| 苏尼特左旗| 滦平县| 宾川县| 长宁区| 昔阳县| 禄丰县| 隆林| 建平县| 隆安县| 临泽县| 山西省| 湖南省| 竹溪县| 安仁县| 高陵县| 志丹县| 麦盖提县| 西藏| 兴安县| 大庆市| 盖州市| 滦平县| 筠连县| 龙口市| 天气| 洛隆县|