中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

JVM GC導致的shuffle文件拉取失敗怎么辦

發布時間:2021-12-16 15:01:35 來源:億速云 閱讀:112 作者:iii 欄目:云計算

本篇內容主要講解“JVM GC導致的shuffle文件拉取失敗怎么辦”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“JVM GC導致的shuffle文件拉取失敗怎么辦”吧!

        有時會出現的一種情況,非常普遍,在spark的作業中;shuffle file not found。(spark作業中,非常非常常見的)而且,有的時候,它是偶爾才會出現的一種情況。有的時候,出現這種情況以后,會重新去提交stage、task。重新執行一遍,發現就好了。沒有這種錯誤了。

log怎么看?

  • 用client模式去提交你的spark作業。比如standalone client;yarn client。一提交作業,直接可以在本地看到刷刷刷更新的log。

  • spark.shuffle.io.maxRetries 3
    //意思就是說,shuffle文件拉取的時候,如果沒有拉取到(拉取失敗),最多或重試幾次(會重新拉取幾次文件),默認是3次。
    
    spark.shuffle.io.retryWait 5s
    //意思就是說,每一次重試拉取文件的時間間隔,默認是5s鐘。


  • 默認情況下,假如說第一個stage的executor正在進行漫長的full gc。第二個stage的executor嘗試去拉取文件,結果沒有拉取到,默認情況下,會反復重試拉取3次,每次間隔是五秒鐘。最多只會等待3 * 5s = 15s。如果15s內,沒有拉取到shuffle file。就會報出shuffle file not found。

  • 針對這種情況,我們完全可以進行預備性的參數調節。增大上述兩個參數的值,達到比較大的一個值,盡量保證第二個stage的task,一定能夠拉取到上一個stage的輸出文件。避免報shuffle file not found。然后可能會重新提交stage和task去執行。那樣反而對性能也不好。

    spark.shuffle.io.maxRetries 60
    spark.shuffle.io.retryWait 60s
  • 最多可以忍受1個小時沒有拉取到shuffle file。只是去設置一個最大的可能的值。full gc不可能1個小時都沒結束吧(低概率,沒有絕對)。這樣呢,就可以盡量避免因為gc導致的shuffle file not found,無法拉取到的問題。

    到此,相信大家對“JVM GC導致的shuffle文件拉取失敗怎么辦”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!

    向AI問一下細節

    免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

    AI

    新平| 长丰县| 太原市| 马公市| 乌兰县| 鸡东县| 二连浩特市| 从化市| 桑植县| 桐柏县| 阿巴嘎旗| 左贡县| 化州市| 抚远县| 乐亭县| 惠州市| 昔阳县| 万载县| 湟中县| 辽宁省| 蓬莱市| 夹江县| 保亭| 上高县| 阳朔县| 北碚区| 久治县| 宜川县| 襄垣县| 共和县| 芦山县| 阿坝县| 广丰县| 芜湖县| 阿荣旗| 三河市| 德阳市| 会昌县| 苏尼特右旗| 库尔勒市| 兴义市|