中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么使用Python?PaddleNLP信息抽取提取快遞單信息

發布時間:2022-06-10 13:43:35 來源:億速云 閱讀:329 作者:iii 欄目:開發技術

這篇文章主要講解了“怎么使用Python PaddleNLP信息抽取提取快遞單信息”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“怎么使用Python PaddleNLP信息抽取提取快遞單信息”吧!

5 條標注數據,搞定物流快遞單信息抽取

據統計,2021 年國內快遞件數超 1000 億件。作為勞動密集型產業,固有模式下出現的快遞人員短缺、配送效率疲軟、物流承載有限等問題,儼然成為物流行業面臨的最直接挑戰。利用智能化手段來提高工作效率、提升用戶體驗,是物流行業最強烈且迫切的需求。

在下單環節,“買賣東西一時爽,信息輸入超麻煩”、“門牌號、手機號碼,這輸錯一個數字就是千差萬別”、“名字還有生僻字,找都找不到” 都道出了不少人的心聲,特別是每天都需處理大量訂單的商家和物流工作人員更是苦不堪言,而這個問題可以靠 NLP 信息抽取技術來解決。

基于此,飛槳自然語言處理模型庫 PaddleNLP 開源了通用信息抽取技術 UIE,能夠大大加快快遞單信息結構化效率。 可輕松實現從用戶提供的文字信息中快速抽取姓名、電話、省、市、區、詳細地址等內容,形成結構化的信息,降低客戶填單成本。

怎么使用Python?PaddleNLP信息抽取提取快遞單信息

圖 1:物流快遞單信息抽取

信息抽取是一個行業應用價值很高的技術,卻因為任務多樣、領域多樣、數據獲取和標注成本高,導致落地成本居高不下。

因此,中科院軟件所和百度共同提出了大一統諸多任務的通用信息抽取技術 UIE(Universal Information Extraction),在實體、關系、事件和情感等 4 個信息抽取任務、13 個數據集的全監督、低資源和少樣本設置下,均取得了 SOTA 性能,這項成果發表在 ACL’22 [1]。

前陣子,百度飛槳的 PaddleNLP 結合文心大模型中的知識增強 NLP 大模型 ERNIE 3.0,發揮了 UIE 在中文任務上的強大潛力,開源了首個面向通用信息抽取的產業級技術方案,不需要標注數據(或僅需少量標注數據),即可快速完成各類信息抽取任務。

怎么使用Python?PaddleNLP信息抽取提取快遞單信息

圖 2:傳統方案 vs UIE 統一建模方案

在物流快遞單信息抽取任務中,僅標注了 5 條樣本,F1 值即提升 18 個點,達到 93% 。相對于傳統序列標注方案動輒標注幾百條、幾千條的高額標注成本。可以說,PaddleNLP 開源的通用信息抽取工具簡直是國貨之光!

這么酷炫的技術能力,如何快速應用到業務中呢?

通過調用 paddlenlp.Taskflow API 即可實現零樣本(zero-shot)抽取多種類型的信息,話不多說,直接上代碼,看效果:

# 快遞單信息抽取
from paddlenlp import Taskflow
schema = ['姓名', '省份', '城市', '縣區']
ie("北京市海淀區上地十街10號18888888888張三")
>>> [{'姓名': [{'text': '張三', 'start': 24, 'end': 26, 'probability': 0.97369767177317}],
   '城市': [{'text': '北京市', 'start': 0, 'end': 3, 'probability': 0.9992830142165161}],
   '縣區': [{'text': '海淀區', 'start': 3, 'end': 6, 'probability': 0.9997933003097614}]}]

對于復雜目標,可以標注少量數據(Few-shot)進行模型訓練,以進一步提升效果。PaddleNLP 打通了從數據標注 - 訓練 - 部署全流程,不僅能夠方便地進行定制化訓練,在部署階段我們也提供了基于 ONNXRuntime 引擎部署、半精度(FP16)推理等多種加速方案,滿足 CPU、GPU 等不同場景下的部署需求。

所有源碼及模型均已開源,大家可以嘗鮮使用,star 鼓勵。

此外,PaddleNLP 還開源了物流快遞單信息抽取產業實踐范例,通過完整的代碼實現,提供從數據準備到模型調優的全過程解析,堪稱產業落地的 “自動導航” 百度高工還將帶來手把手進行全流程代碼實踐,輕松直達項目 POC 階段。

智能立體庫盤點

物流行業的貨物存儲庫有從單一存儲特性的立體庫向多功能智能化物流倉轉化的發展趨勢,包括賦能智慧物流集收貨、配送、分揀、客戶化定制等功能一體的智能物流庫,賦能智能制造集存儲、線邊自動補給、集成自動化生產工藝為一體的多功能物流庫。

針對這一趨勢下的多功能智能化物流倉進行智能盤點,相較傳統物流倉而言,其難度也增加了不少,主要包括:前端工藝、安全管理制約、存儲點動態監控、全流程多點監控等,如圖 3 所示。

怎么使用Python?PaddleNLP信息抽取提取快遞單信息

圖 3:多功能智能化物流倉的智能盤點難度

飛槳零門檻 AI 開發平臺 EasyDL 可從 0 到 1 快速構建針對多功能智能化物流倉的智能盤點的 AI 模型,最快 15 分鐘即可完成模型訓練。

使用流程下圖所示。

怎么使用Python?PaddleNLP信息抽取提取快遞單信息

 圖 4: AI 模型訓練及部署流程

無需關注模型細節,即便是沒有任何 AI 基礎,也能快速上手使用!使用 EasyDL - 圖像分割任務進行模型訓練,最終模型效果可以達到 99.9%,充分滿足產業應用的需求。

怎么使用Python?PaddleNLP信息抽取提取快遞單信息

圖 5: 模型效果

物流行業自動化近年來蓬勃發展,智能化立體庫、自動碼垛、自動搬運、自動裝車、智能分揀等相關設備在各行業應用廣泛。在產品在途、在庫信息查詢、產品溯源等各個環節中,AI 技術都發揮了至關重要的作用,大大節約了物流成本,提高了物流效率和盤點效率。

感謝各位的閱讀,以上就是“怎么使用Python PaddleNLP信息抽取提取快遞單信息”的內容了,經過本文的學習后,相信大家對怎么使用Python PaddleNLP信息抽取提取快遞單信息這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

凌源市| 垦利县| 赤峰市| 常熟市| 休宁县| 塔河县| 西乌| 子长县| 分宜县| 台东县| 富顺县| 东山县| 乌恰县| 莱阳市| 孝感市| 广河县| 东丰县| 尤溪县| 胶南市| 荥阳市| 东安县| 抚州市| 嫩江县| 建阳市| 马鞍山市| 湖北省| 龙口市| 仙游县| 陵水| 巴塘县| 郓城县| 维西| 遵义市| 静安区| 曲水县| 射阳县| 澄城县| 鸡东县| 玛多县| 鹿泉市| 南康市|