Pytorch中net.train 和 net.eval怎么用

發布時間：2021-05-23 08:22:16 來源：億速云閱讀：414 作者：小新欄目：開發技術

這篇文章主要介紹Pytorch中net.train 和 net.eval怎么用，文中介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們一定要看完！

在訓練模型時會在前面加上：

model.train()

在測試模型時在前面使用：

model.eval()

同時發現，如果不寫這兩個程序也可以運行，這是因為這兩個方法是針對在網絡訓練和測試時采用不同方式的情況，比如Batch Normalization 和 Dropout。

訓練時是正對每個min-batch的，但是在測試中往往是針對單張圖片，即不存在min-batch的概念。

由于網絡訓練完畢后參數都是固定的，因此每個批次的均值和方差都是不變的，因此直接結算所有batch的均值和方差。

所有Batch Normalization的訓練和測試時的操作不同

在訓練中，每個隱層的神經元先乘概率P，然后在進行激活，在測試中，所有的神經元先進行激活，然后每個隱層神經元的輸出乘P。

補充：Pytorch踩坑記錄——model.eval()

最近在寫代碼時遇到一個問題，原本訓練好的模型，加載進來進行inference準確率直接掉了5個點，尼瑪，這簡直不能忍啊～本菜雞下意識地感知到我肯定又在哪里寫了bug了～～～于是開始到處排查，從model load到data load，最終在一個被我封裝好的module的犄角旮旯里找到了問題，于是順便就在這里總結一下，避免以后再犯。

對于訓練好的模型加載進來準確率和原先的不符，比較常見的有兩方面的原因：

1）data

2）model.state_dict()

1） data

數據方面，檢查前后兩次加載的data有沒有發生變化。首先檢查 transforms.Normalize 使用的均值和方差是否和訓練時相同；另外檢查在這個過程中數據是否經過了存儲形式的改變，這有可能會帶來數據精度的變化導致一定的信息丟失。

比如我過用的其中一個數據集，原先將圖片存儲成向量形式，但其對應的是“png”格式的數據（后來在原始文件中發現了相應的描述。），而我進行了一次data-to-img操作，將向量轉換成了“jpg”形式，這時加載進來便造成了掉點。

2）model.state_dict()

第一方面造成的掉點一般不會太嚴重，第二方面造成的掉點就比較嚴重了，一旦模型的參數加載錯了，那就誤差大了。

如果是參數沒有正確加載進來則比較容易發現，這時準確率非常低，幾乎等于瞎猜。

而我這次遇到的情況是，準確率并不是特別低，只掉了幾個點，檢查了多次，均顯示模型參數已經成功加載了。后來仔細查看后發現在其中一次調用模型進行inference時，忘了寫 ‘model.eval()'，造成了模型的參數發生變化，再次調用則出現了掉點。

于是又回顧了一下model.eval()和model.train()的具體作用。如下：

model.train() 和 model.eval() 一般在模型訓練和評價的時候會加上這兩句，主要是針對由于model 在訓練時和評價時 Batch

Normalization 和 Dropout 方法模式不同：

a) model.eval()，不啟用 BatchNormalization 和 Dropout。此時pytorch會自動把BN和DropOut固定住，不會取平均，而是用訓練好的值。不然的話，一旦test的batch_size過小，很容易就會因BN層導致模型performance損失較大；

b) model.train() ：啟用 BatchNormalization 和 Dropout。在模型測試階段使用model.train() 讓model變成訓練模式，此時 dropout和batch normalization的操作在訓練q起到防止網絡過擬合的問題。

因此，在使用PyTorch進行訓練和測試時一定要記得把實例化的model指定train/eval。

model.eval()   vs   torch.no_grad()

雖然二者都是eval的時候使用，但其作用并不相同:

model.eval() 負責改變batchnorm、dropout的工作方式，如在eval()模式下，dropout是不工作的。見下方代碼：

  import torch
  import torch.nn as nn
 
  drop = nn.Dropout()
  x = torch.ones(10)
  
  # Train mode   
  drop.train()
  print(drop(x)) # tensor([2., 2., 0., 2., 2., 2., 2., 0., 0., 2.])   
  
  # Eval mode   
  drop.eval()
  print(drop(x)) # tensor([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

torch.no_grad() 負責關掉梯度計算，節省eval的時間。

只進行inference時，model.eval()是必須使用的，否則會影響結果準確性。而torch.no_grad()并不是強制的，只影響運行效率。

pytorch的優點

1.PyTorch是相當簡潔且高效快速的框架；2.設計追求最少的封裝；3.設計符合人類思維，它讓用戶盡可能地專注于實現自己的想法；4.與google的Tensorflow類似，FAIR的支持足以確保PyTorch獲得持續的開發更新；5.PyTorch作者親自維護的論壇供用戶交流和求教問題6.入門簡單

以上是“Pytorch中net.train 和 net.eval怎么用”這篇文章的所有內容，感謝各位的閱讀！希望分享的內容對大家有幫助，更多相關知識，歡迎關注億速云行業資訊頻道！

向AI問一下細節

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

Pytorch中net.train 和 net.eval怎么用

在訓練模型時會在前面加上：

在測試模型時在前面使用：

對于訓練好的模型加載進來準確率和原先的不符，比較常見的有兩方面的原因：

1） data

2）model.state_dict()

Normalization 和 Dropout 方法模式不同：

pytorch的優點

猜你喜歡

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

Pytorch中net.train 和 net.eval怎么用

在訓練模型時會在前面加上：

在測試模型時在前面使用：

對于訓練好的模型加載進來準確率和原先的不符，比較常見的有兩方面的原因：

1） data

2）model.state_dict()

Normalization 和 Dropout 方法模式不同：

pytorch的優點

猜你喜歡

最新資訊

相關推薦

相關標簽