您好,登錄后才能下訂單哦!
小編給大家分享一下如何使用ABAP正則表達式解析HTML標簽,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!
需求就是我用ABAP的某個函數從數據庫讀取一個字符串出來,該字符串的內容是一個網頁。
網頁的form里包含了很多隱藏的input field。我的任務是解析出name為svyValueGuid的input field的值:FA163EEF573D1ED89E89C7FE5E7C4715
最簡單粗暴的做法是:利用ABAP的FIND FIRST OCCURRENCE關鍵字首先找到svyValueGuid的偏移量,然后從這個偏移量出發,再找到第一個>的偏移量,這樣問題就化簡為在子串type="hidden" value="FA163EEF573D1ED89E89C7FE5E7C4715",這樣問題就簡單多了。但是這種辦法比較笨重,代碼很冗余。
有沒有更快捷的辦法呢?那就是使用ABAP regular expression,即正則表達式。
請看下列的測試代碼:
REPORT ztest_interface. DATA: lv_input TYPE string, reg_pattern TYPE string. lv_input = `<body>` && `<div class="Title">Jerry's Programming Skill survey</div>` && `<form action="Survey.htm?sap-client=001">` && `<input name="svyApplicationId" type="hidden" value="CRM_SURVEY_ACTIVITY">` && `<input name="svyValueGuid" type="hidden" value="FA163EEF573D1ED89E89C7FE5E7C4715">` && `<input name="SurveyId" type="hidden" value="JERRY_TEST">` && `<div Id="" class="Section1">` && `</form></body>`. reg_pattern = '.*svyValueGuid(?:.*)value="(.*)">.*SurveyId.*'. TRY. DATA(lo_regex) = NEW cl_abap_regex( pattern = reg_pattern ). DATA(lo_matcher) = lo_regex->create_matcher( EXPORTING text = lv_input ). IF lo_matcher->match( ) <> abap_true. WRITE:/ 'fail in input scan!'. RETURN. ENDIF. DATA(lt_reg_match_result) = lo_matcher->find_all( ). READ TABLE lt_reg_match_result ASSIGNING FIELD-SYMBOL(<match>) INDEX 1. READ TABLE <match>-submatches ASSIGNING FIELD-SYMBOL(<sub>) INDEX 1. data(lv_sub) = lv_input+<sub>-offset(<sub>-length). WRITE:/ 'result: ', lv_sub. CATCH cx_root INTO DATA(cx_root). WRITE:/ cx_root->get_text( ). RETURN. ENDTRY.
執行結果:
解決問題的核心思路是這個正則表達式:.svyValueGuid(?:.)value="(.)">.SurveyId.***
通過捕獲分組操作符,一對小括號,將32位的GUID值進行捕獲。這種解法比FIND FIRST OCCURANCE的代碼量要少。
看完了這篇文章,相信你對“如何使用ABAP正則表達式解析HTML標簽”有了一定的了解,如果想了解更多相關知識,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。