您好,登錄后才能下訂單哦!
之前做過用java讀取word文檔,獲取word文本內容。
但發現docx的支持,doc就異常了。
后來找了很多資料發現是解析方法不一樣。
首先要導入poi相關的jar包
我用的是maven,pom.xml引入如下:
<dependency> <groupId>org.apache.poi</groupId> <artifactId>poi-ooxml</artifactId> <version>3.8</version> </dependency> <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi-scratchpad</artifactId> <version>3.8</version> </dependency>
java獲取word文本內容如下:
public BaseResp getParsedTxt(MultipartFile file) throws Exception { BaseResp br=new BaseResp("200","") ; String textType = file.getContentType(); String txt = ""; if(textType.equals(TXT_TYPE)){ String code = getCharset(file); txt = new String(file.getBytes(),code); }else if(textType.equals(DOC_TYPE)){ HWPFDocument doc = new HWPFDocument(file.getInputStream()); Range rang = doc.getRange(); txt = rang.text(); System.out.println(txt); }else if(textType.equals(DOCX_TYPE)){ File uFile = new File("tempFile.docx"); if(!uFile.exists()){ uFile.createNewFile(); } FileCopyUtils.copy(file.getBytes(), uFile); OPCPackage opcPackage = POIXMLDocument.openPackage("tempFile.docx"); POIXMLTextExtractor extractor = new XWPFWordExtractor(opcPackage); txt= extractor.getText(); uFile.delete(); }else{ br = new BaseResp("300","上傳文件格式錯誤,請上傳.txt或者.docx"); return br; } br.setDatas(txt); return br; }
功能實現了。
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持億速云。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。