您好,登錄后才能下訂單哦!
這篇文章主要為大家展示了“linux中perf有什么用”,內容簡而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領大家一起研究并學習一下“linux中perf有什么用”這篇文章吧。
perf是linux系統中提供的性能分析工具,它基于一個叫“Performance counters”的內核子系統實現,同時支持硬件(CPU、PMU(Performance Monitoring Unit))和軟件(軟件計數器、tracepoint)層面的性能分析。
perf中的事件
perf與其他性能調優工具一樣,都是通過對監測對象進行采樣,根據采樣點的分布來推斷整個程序的行為。通過perf list命令我們可以看到perf支持很多的采樣事件,比如branch-misses、cpu-clock等等。perf中預定義的事件屬于不同的類型,比如硬件產生的事件(cache 命中/分支miss)和軟件產生的事件(context switch/page fault)等等。
tracepoint
tracepoint是linux內核中定義的一些hook,如果被開啟,它們就會在執行到特定邏輯時被觸發,方便其他工具獲取系統內部的運行狀態等信息,perf就是利用了tracepoint,它會記錄和統計tracepoint的各個事件,生成分析報告。
使用方式
perf 工具的具體使用方式如下:
perf [--version] [--help] COMMAND [ARGS]
其中的COMMAND列表可以通過執行perf --help查看,下面列舉幾個常用的command。
perf stat
perf stat的作用是執行一個命令并收集其運行過程中的各個數據,它可以提供一個程序運行情況的總體概覽。比如:
user@localhost:~$ perf stat hostname localhost Performance counter stats for 'hostname': 0.313464 task-clock (msec) # 0.481 CPUs utilized 2 context-switches # 0.006 M/sec 0 cpu-migrations # 0.000 K/sec 153 page-faults # 0.488 M/sec 896,723 cycles # 2.861 GHz 620,709 instructions # 0.69 insn per cycle 121,143 branches # 386.465 M/sec 6,247 branch-misses # 5.16% of all branches 0.000651441 seconds time elapsed
上面這個例子,通過perf stat運行了hostname命令,并將其運行過程中的一些指標匯總顯示了出來,比如task-clock、context-switches等待。默認情況下,perf stat 會輸出幾個常用的事件的統計,比如:
task-clock-msecs:cpu 使用率 context-switches:進程切換次數 page-faults:發生缺頁的次數 cpu-migrations:表示進程運行過程中發生了多少次CPU遷移,即被調度器從一個CPU轉移到另外一個CPU上運行 cycles:處理器時鐘,一條機器指令可能需要多個cycles instructions: 機器指令數目 branches:遇到的分支指令數 branch-misses是預測錯誤的分支指令數
除此之外,我們可以使用-e參數來指定我們感興趣的事件,比如:
user@localhost:~$ perf stat -e cache-misses hostname localhost Performance counter stats for 'hostname': 682 cache-misses 0.000646676 seconds time elapsed
perf top
perf top的作用是實時地顯示系統當前的性能統計信息。前面的perf stat用于對一個特定的程序進行分析,而某些時候我們可能并不知道是哪個程序影響了系統性能,這時候就可以用perf top來查找可疑的程序。比如:
Samples: 775 of event 'cpu-clock', Event count (approx.): 92931021 Overhead Shared Object Symbol 8.93% [kernel] [k] vsnprintf 7.73% perf [.] rb_next 5.92% [kernel] [k] kallsyms_expand_symbol.clone.0 5.07% [kernel] [k] format_decode 4.59% [kernel] [k] number 3.40% perf [.] symbols__insert 3.03% libslang.so.2.2.1 [.] SLtt_smart_puts
上面的例子顯示perf統計了cpu-clock事件的數據,根據比例進行了排序。和perf stat一樣,我們可以通過-e參數指定統計其他的事件,比如perf top -e context-switches可以查看進程切換最多的top N個進程。
perf record & perf report
perf record的作用和perf stat類似,它可以運行一個命令并生成統計信息,不過perf record不會將結果顯示出來,而是將結果輸出到文件中。perf record生成的文件可以用perf report來進行解析。
perf record還可以通過-g參數,在分析時生成calling graph,幫助定位更上層的邏輯分布。
其他
通過例子我們可以發現,perf的分析結果中的Symbol一列顯示的都是c語言函數的名字。對于java來說,jit編譯產生的函數就會直接顯示在symbol里,而不是java的函數名,這時要定位問題就不是那么容易了,我們需要通過額外的手段將symbol和java程序的符號表對應起來,具體后續再討論了。
以上是“linux中perf有什么用”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。