大數據中適用于少量數據的深度學習結構是什么

發布時間：2022-01-04 15:47:54 來源：億速云閱讀：182 作者：柒染欄目：大數據

這期內容當中小編將會給大家帶來有關大數據中適用于少量數據的深度學習結構是什么，文章內容豐富且以專業的角度為大家分析和敘述，閱讀完這篇文章希望大家可以有所收獲。

導讀

一些最常用的few shot learning的方案介紹及對比。

傳統的CNNs (AlexNet, VGG, GoogLeNet, ResNet, DenseNet…)在數據集中每個類樣本數量較多的情況下表現良好。不幸的是，當你擁有一個小數據集時，它們通常不能很好地工作。但是，在許多真實的場景中，收集數據是很有挑戰性的。例如，在人臉識別系統中，通常每個人的圖像都很少，或者在醫學領域中，一些罕見疾病的病例也很有限。

那么，當你的類別中只有5個樣本，甚至每個類別只有一個樣本時，深度學習能提供什么呢？這個問題被稱為few-shot learning。這是一個活躍的研究領域，有許多成功的方法可以采用。在本文中，我將只提到一些最有前途的體系結構。

這篇文章不會深入地解釋架構，因為這會使文章變得很長。相反，我將只介紹架構的主要思想，以便任何希望處理小數據集的人都可以對模型有一個大致的了解。

Siamese Neural Networks

大數據中適用于少量數據的深度學習結構是什么

Siamese Neural Networks的結構

Siamese神經網絡以兩個樣本作為輸入，輸出給定輸入是否屬于同一類的概率(或損失)。輸入樣本通過相同的網絡(共享權值)，它們的嵌入在損失函數中進行比較(通常使用基于嵌入的差異的度量)。在訓練過程中，“網絡”學會以更穩健的方式對輸入進行編碼。首先，在支持集(驗證步驟)上對模型進行訓練，以學習相同/不同的配對。然后，將測試樣本與訓練集中的每個樣本進行比較，得到基于學習的編碼后的測試樣本與每個類(one-shot task)的相似度。它是在few-shot學習領域中第一個成功的模型之一，并成為其他模型的基礎。

大數據中適用于少量數據的深度學習結構是什么

Siamese Neural Networks的步驟

Triplet Network and Triplet Loss

大數據中適用于少量數據的深度學習結構是什么

Triplet Networks

Triplet Network是對Siamese 網絡的擴展。Triplet網絡不使用兩個樣本，而是使用三個樣本作為輸入：positive、anchor和negative樣本。Positive樣本和anchor樣本來自同一類，negative樣本來自不同類。Triplet損失的安排使得anchor的嵌入靠近positive而遠離negative。通過這種方式，網絡在提取嵌入信息時變得更加健壯。Triplet Networks已應用于人臉識別數據集，顯示出非常好的性能。

大數據中適用于少量數據的深度學習結構是什么

Triplet Loss

Matching Networks

大數據中適用于少量數據的深度學習結構是什么

Matching Networks

匹配網絡將嵌入和分類相結合，形成端到端可微的最近鄰分類器。對于模型的預測，y?是標簽的加權和，y?是訓練集。權重是成對相似性函數a(?????, x?)，查詢(測試)樣本和支持(訓練)樣本之間的相似性。匹配網絡的關鍵是相似函數的可微性。

大數據中適用于少量數據的深度學習結構是什么

其中C代表了余弦相似度函數，k是在訓練集中的樣本總數，函數f* 和g是嵌入函數。總體而言，在測試樣本?????的嵌入和訓練集樣本x?的嵌入之間計算相似性。這個工作的主要創新點就是對嵌入函數優化得到最大的分類精度。

Prototypical Networks

大數據中適用于少量數據的深度學習結構是什么

Prototypical Networks

原型網絡不將測試樣本與所有訓練樣本進行比較，而是將測試樣本與類原型(或平均類嵌入)進行比較。其關鍵假設是對于每個類別，存在一個嵌入，簇樣本的表示是分布在這個原型的嵌入c?的周圍的。在他們的論文中，證明了它的性能優于匹配網絡。

Meta-Learning

大數據中適用于少量數據的深度學習結構是什么

模型不可知Meta-Learning

元學習意味著學會學習。元學習試圖訓練模型的參數，使其通過一個或多個梯度步驟(像人類一樣)在新任務中表現最佳。模型的參數根據更新后的特定于任務的參數進行更新，使得任何任務在完成單一步驟后，其性能都是最高的。

與模型無關的元學習(MAML)的目的是學習一個通用的模型，這個模型可以很容易地對許多任務進行微調，只需要幾個迭代步驟。對于元批處理中的每個任務，使用基模型的權重初始化一個模型。采用隨機梯度下降(SGD)算法更新特定任務的權值。然后，使用更新后權重的損失總和來更新元學習者的權重。這里的目標是，對于幾個不同的任務，這些參數的損失將會很小。

大數據中適用于少量數據的深度學習結構是什么

模型不可知Meta-Learning算法

Bonus: MetaFGNet

大數據中適用于少量數據的深度學習結構是什么

MetaFGNet

除了目標任務網絡外，MetaFGNet還使用輔助數據訓練網絡。這兩個網絡共享初始層(基礎網絡)以學習一般信息。這種方法也被稱為多任務學習。將輔助數據(S)與目標數據(T)進行訓練，對目標訓練產生正則化效果。MetaFGNet還使用了一個名為sample selection的過程。輔助數據中的樣本通過網絡，對目標分類器的相似度打分，同時也計算源分類器。如果相似性高，得分也會高。只選擇得分閾值以上的樣本進行訓練。這里主要假設輔助數據S應該具有與目標集T類似的分布。結果表明，該過程提高了整體性能。使用元學習方法進行訓練效果有提升。

上述就是小編為大家分享的大數據中適用于少量數據的深度學習結構是什么了，如果剛好有類似的疑惑，不妨參照上述分析進行理解。如果想知道更多相關知識，歡迎關注億速云行業資訊頻道。

向AI問一下細節

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站