您好,登錄后才能下訂單哦!
這篇文章給大家分享的是有關selenium怎么處理iframe作用域問題的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。
在使用python進行爬蟲操作的過程中,一般為了防止爬蟲,會使用iframe,但是由于iframe有限制,iframe是前端內嵌頁面,訪問域名與主網頁不同,所以有時會得到不自己想要的數據。本文針對抓包工具定位沒有定位到iframe中的小的html中提供解決方法。
以文本塊生成xpath為/html/body/text(),根據xpath進行如下代碼編寫。
#!/user/bin/ # -*- coding:UTF-8 -*- # Author:Master from selenium import webdriver import time driver = webdriver.Chrome(executable_path="./chromedriver") driver.get('https://www.runoob.com/try/runcode.php?filename=HelloWorld&type=python3') time.sleep(2) text = driver.find_element_by_xpath('/html/body').text print(text) time.sleep(5) driver.quit()
得到結果
原因分析
當我們打開抓包工具定位到Hello, World!文本的時候會發現,該文本是在一個iframe中。這樣的話我們xpath所定位到的內容則是大的html中的路徑。我們需要的內容則是在iframe中的小的html中。
解決方法
通過分析發現,想要解決問題的實質就是改變作用域。通過switch_to.frame(‘id’)方法來改變作用域就可以了。
重新編寫代碼:
#!/user/bin/ # -*- coding:UTF-8 -*- # Author:Master from selenium import webdriver import time driver = webdriver.Chrome(executable_path="./chromedriver") driver.get('https://www.runoob.com/try/runcode.php?filename=HelloWorld&type=python3') time.sleep(2) driver.switch_to.frame('iframeResult') text = driver.find_element_by_xpath('/html/body').text print(text) time.sleep(5) driver.quit()
運行結果
感謝各位的閱讀!關于“selenium怎么處理iframe作用域問題”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。