您好,登錄后才能下訂單哦!
這篇文章主要講解了“java啟動參數如何排查”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“java啟動參數如何排查”吧!
我們的應用是java應用,jdk版本是Open-jdk8,阿里云agent是直接注入到容器中的,因此會將agent啟動參數自動注入到 JAVA_TOOL_OPTIONS 環境變量中,當應用啟動時會自動帶上agent啟動參數。
agent沒注冊,首先檢查應用的啟動日志,發現應用是啟動成功的,tomcat端口都是正常的。仔細觀察日志,發現了問題。由于agent 啟動參數是注入到 JAVA_TOOL_OPTIONS 中的,通常jvm 在啟動的時候會優先加載 JAVA_TOOL_OPTIONS,日志中會出現 Picked up JAVA_TOOL_OPTIONS
的字樣,如下圖所示,但是問題現場卻沒有這一行和agent相關的啟動日志,說明 jvm 啟動的時候并沒有加載 JAVA_TOOL_OPTIONS。
我們開始懷疑是 agent啟動參數 的問題,以為是agent在容器重建時沒有將啟動參數注入到環境變量中。但是通過環境變量一看,發現 JAVA_TOOL_OPTIONS 是在的,而且每個agent的參數都是齊全的。
這個時候就開始懷疑是不是啟動腳本的問題,是不是有人在啟動腳本中加了unset JAVA_TOOL_OPTIONS
,因為當存在JAVA_TOOL_OPTIONS時,使用jdk相關的命令都會帶上JAVA_TOOL_OPTIONS中的參數,造成一定的困擾,所以有時候在排查問題的時候會先unset掉這個變量,但是檢查完腳本也沒有問題。
最后開始咨詢阿里云的工程師,懷疑是不是agent或者容器環境有問題。經過反復比較正常容器和問題容器的JAVA_TOOL_OPTIONS啟動參數,發現問題容器因為多加載一個agent,JAVA_TOOL_OPTIONS多出來一段參數,去掉這段參數就能恢復正常,加上就會有問題。到這里,可能正常的思路都是懷疑是多出來的參數造成的。但在排查其他正常容器時發現,有的容器即使有這一段參數也能正常啟動。
這個時候,阿里云的工程師懷疑是不是參數太長導致的,因為有問題的容器的應用名字比較長,于是我們開始測試,發現確實是這個問題,如下圖所示。隨后確定了問題所在,jdk8 在加載默認環境變量時會檢查長度,當大于1024字節時就會加載失敗。
在jdk相關的環境變量中,有兩種默認的環境變量 JAVA_TOOL_OPTIONS
和 _JAVA_OPTIONS
。
JAVA_TOOL_OPTIONS:在jdk8及之前版本中,該變量是最標準的,所有虛擬機都能識別和應用的環境變量,在jdk9之后被JDK_JAVA_OPTIONS
所取代。該變量限制1024字節,在不同虛擬機中表現不一樣,有的是加載失敗,有的是截取一段。
_JAVA_OPTIONS:也是默認的環境變量,但是它是JVM廠家自定義的,可以覆蓋JAVA_TOOL_OPTIONS,但各廠家的命名不同,_JAVA_OPTIONS是Oracle的JVM,而IBM的則是用IBM_JAVA_OPTIONS。
因此為避免出現問題,我們應該盡量避免使用默認的環境變量,通常情況下可以在腳本中自定義啟動變量如 JAVA_OPTS
、SPRINGBOOT_OPTS
等等。然后在啟動java時顯式的指定啟動參數。
java [-options] -jar xxx.jar [args…] 可以寫成 JAVA_OPTS="[-options]" JAVA_ARGS="[args…]" java ${JAVA_OPTS} -jar xxx.jar ${JAVA_ARGS}
項目打包后在測試環境的啟停都是個體力活,剛好又給筆者遇到了,綜合別人的腳本記錄了一下
APP_NAME=xxx.jar pid=jps -l | grep $APP_NAME if [ -z $pid ]; then echo "$APP_NAME started" else echo "$APP_NAME stoped" fi # 普通進程的 # pid=ps -ef | grep $APP_NAME | grep -v grep | awk '{print $2}'
APP_NAME=xxxx-1.0-SNAPSHOT.jar pid=0 checkpid() { javaps=`jps -l | grep $APP_NAME` if [ -n "$javaps" ]; then pid=`echo $javaps | awk '{print $1}'` else pid=0 } start() { checkpid if [ $psid -ne 0 ]; then echo "$APP_NAME already started" else echo "Starting $APP_NAME ..." `nohup java -jar $APP_NAME > $APP_NAME'.out' 2>&1 &` checkpid if [ $pid -ne 0]; then echo "$APP_NAME start success" else echo "$APP_NAME start faild" fi fi } stop() { checkpid if [ $pid -ne 0 ]; then echo "Stoping $APP_NAME..." kill -9 $pid if [$? -eq 0 ]; then echo "$APP_NAME stop success" else echo "$APP_NAME stop faild" fi else echo "$APP_NAME already stoped" fi } case "$1" in 'start') start ;; 'stop') stop ;; 'restart') stop start ;; *) # 其他任何情況 echo "help: $0 {start|stop|restart}" echo "例子: ./deploy start exit 1 esac exit 0
感謝各位的閱讀,以上就是“java啟動參數如何排查”的內容了,經過本文的學習后,相信大家對java啟動參數如何排查這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。