您好,登錄后才能下訂單哦!
如果你用過機器學習算法,那一定體驗被算法調參支配的恐怖。面對錯綜復雜的算法參數,算法使用者們往往要花費無盡的黑夜去不斷嘗試,猶如大海撈針。有的時候加班到深夜,終于找到了一個靠譜的參數組合,然而找到的參數組合真的是最優的么?天知道。
然而在搭建機器學習鏈路的過程中,往往不止調參這一步耗時耗力。好不容易生成了算法模型,怎么把模型部署成服務供手機、PC這些終端調用也是困擾開發同學的一大難題。有的時候,為了打通這樣的鏈路,要耗費整晚的時間調試不同格式的模型和服務端的關聯。
人工智能服務在便捷了人類生活的同時,能不能也為廣大算法工程師提供人性化的開發環境呢?減少黑眼圈是算法工程師共同的心愿。對于這個問題,PAI給出了答案,今日PAI重磅發布全套自動化機器學習引擎,用機器學習的方式解決機器學習流程的問題。
下面看看什么是PAI-AutoML, AutoML顧名思義,就是將機器學習整個流程做到自動化。機器學習數據上傳之后的流程大致可以分為3個步驟:模型訓練、模型評估、模型部署。
PAI自動調參功能對于資深算法使用者以及算法小白都有很大價值:
針對小白用戶:小白用戶不清楚每種算法參數在算法計算過程中的數學原理,往往對調參一頭霧水,所以自動調參可以快速幫助這部分用戶解決問題
針對資深用戶:資深用戶對于調參往往有一定經驗,但是這種經驗往往只能在大方向上指導調參工作,對于一些細節參數仍需要不斷重復去嘗試。比如一個參數范圍0~100,資深用戶可以通過經驗確定參數設置為90或者80的結果,但是在更小粒度上,比如81和82哪個對結果更好,資深用戶也需要手動去實驗。而自定調參功能可以代替這部分的重復性勞動。
目前行業中主流的調參思想主要是基于Parallel Search,以grid search和random search為代表,系統通過隨機原理,不斷采樣可能的參數組合,通過不停迭代去嘗試找到最優的參數組,每次探索的過程彼此獨立。優勢是不容易陷入局部最優解,可以在更廣闊的參數空間探索。劣勢是每次探索都是隨機性的,缺乏信息的積累過程,耗費計算資源。
PAI提供了原創的Evolutionary Optimizer進化式的調參方法,讓模型的每一次迭代都自動在上一輪較優的參數集區間中進行開發,內置的高效算法可以快速的幫你找到最合適的參數組合,大大減少計算資源消耗以及參數探索的次數。你要做的只是泡上一壺茶,靜靜等待奇跡的降臨。
PAI進化式調參迭代效果圖,可以清楚地看到每一輪迭代對于效果的提升:
PAI AutoML提供多維度的算法評估方法,只要在F1Score、Precision、Recall、AUC中選擇自己所需要的評估指標,系統會自動完成模型評估工作并將服務下發到下游的訓練環境,所有評估流程完全不需人工參與。
模型排序表:
模型下發配置:
生成了模型,可以在PAI平臺一鍵將模型發布成API服務。只要點擊部署按鈕,就會列出當前實驗可部署的模型,選擇需要的模型就可以一鍵完成部署,是不是很簡單。
部署完成后會自動跳轉到在線服務管控平臺,在這里可以進行全部的模型管理相關工作。
PAI-AutoML看上去很厲害,是不是真正能幫助到用戶的業務呢,下面看下PAI在阿里云平臺上用戶使用之后的反饋。先介紹下客戶:椰子傳媒是一家專注在移動原生交互視頻廣告的公司,在獎勵視頻行業深耕了2年多,隨著業務規模的增長,多平臺、多渠道,多模式下的智能投放效率問題越來越突出。
椰子科技技術負責人說:阿里PAI平臺提供了一個低門檻、快速上手的服務能力,使得業務可以快速的對接到基于大數據的機器學習平臺上,有力的推動公司業務的快速發展。基于PAI AutoML引擎,可以讓我們更快速的在不同平臺和模式下定位目標用戶。
椰子傳媒通過使用PAI AutoML引擎,調參服務幫助模型提升精度40%,自動化部署預計全部業務上線后可達千萬次,節省人力20%-30%,最重要的是將業務構建在機器學習服務平臺的時間縮短了至少半年時間。
架構圖:
PAI AutoML引擎擬在最大限度上減少機器學習業務搭建成本,目前上線的模型訓練參數調優和模型一鍵自動部署服務已經在節約人力開銷方面提供幫助。未來PAI平臺還會在這個方向繼續投入,真正做到讓機器學習不再是個高門檻技術,讓人工智能觸手可及。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。