您好,登錄后才能下訂單哦!
這篇文章主要介紹“怎么解決php讀取word中文亂碼問題”,在日常操作中,相信很多人在怎么解決php讀取word中文亂碼問題問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”怎么解決php讀取word中文亂碼問題”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!
php讀取word中文亂碼的解決辦法:1、查看php版本;2、修改php.ini并且重啟服務器;3、通過“iconv('GB2312', 'UTF-8', $test);”解決讀取過程中亂碼問題即可。
本文操作環境:Windows7系統,PHP7.4版,Dell G3電腦。
如何解決php讀取word 中文亂碼問題?
php讀取word文件過程中亂碼,怎么解決?
一、首先要確認php版本,最好是高于5.6
二、啟用PHP Com 擴展
// 將以下兩行代碼放入php.ini中, 并且重啟服務器 // 開啟擴展 extension=php_com_dotnet.dll // COM擴展里自帶的,只需將前面的;去掉就可以了 com.allow_dcom = true
三、代碼如下:
public function readWord($url) { $word = new COM("word.application") or die("Unable to instantiate Word"); // 打開路徑為URL的word,doc或docx都可以 $word->Documents->OPen($url); // 讀取內容 $test= $word->ActiveDocument->content->Text; // 統計字數 // $num = strlen($test); // 解決讀取過程中亂碼問題 $content= iconv('GB2312', 'UTF-8', $test); // 查看版本 // $word_wersion = $word->Version; // 是否要打開文件,0代表否,1代表是 $word->Visible = 0; // 關閉word句柄 $word->Quit(); // 釋放對象 $word = null; return [ // 'num' => $num / 2, // 'word_wersion' => $wordWersion, 'content' => $content ]; }
注意:
問題一:
文件url有一個地方需要注意,就是你們傳進來的url千萬不能是絕對地址,不能是D:\WWW\這種,,一定要自己框架的路由地址,比如localhost/…,不然會出現錯誤,因為用絕對地址讀取word內容,只能讀取一次,然后word就會被鎖定,然后就無法讀取了。
問題二:
使用這種方式雖然解決了讀取Word內容亂碼的問題,但是只限于讀取純文本的Word,而且是沒有樣式的那種。如果需要獲取Word文檔的內容包括樣式、圖片、字體等,這種方式就不適合。
我們處理的方式是,采用Aspos。用Java做了一個底層服務,把上傳的Word文檔都轉成html格式的,如果文檔中有圖片的話,轉換后圖片會被提取到同級目錄,并在生成的html文件中留下 <img>
標簽。 這樣Word文檔中的字體和樣式就變成了了HTML代碼,最大程度保留了原文檔的樣式。
到此,關于“怎么解決php讀取word中文亂碼問題”的學習就結束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續學習更多相關知識,請繼續關注億速云網站,小編會繼續努力為大家帶來更多實用的文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。