您好,登錄后才能下訂單哦!
這篇文章主要介紹“怎么使用python庫selenium采集抖音數據”,在日常操作中,相信很多人在怎么使用python庫selenium采集抖音數據問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”怎么使用python庫selenium采集抖音數據”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!
pip install Selenium
Chrome 是初始化谷歌瀏覽器
Firefox 是初始化火狐瀏覽器
Edge 是初始化IE瀏覽器
PhantomJS 是一個無界面瀏覽器。
from selenium import webdriver driver = webdriver.Chrome()
maximize_window 最大化窗口
set_window_size 自定義窗口大小
from selenium import webdriver driver = webdriver.Chrome() driver.maximize_window()
from selenium import webdriver driver = webdriver.Chrome() driver.get('https://www.baidu.com')
定位元素的基本方法如下
定位一個元素 | 定位多個元素 | 解釋 |
---|---|---|
find_element_by_id | find_elements_by_id | 通過元素id定位 |
find_element_by_name | find_elements_by_name | 通過元素name定位 |
find_element_by_xpath | find_elements_by_xpath | 通過xpath表達式定位 |
find_element_by_link_text | find_elements_by_link_tex | 通過完整超鏈接定位 |
find_element_by_partial_link_text | find_elements_by_partial_link_text | 通過部分鏈接定位 |
find_element_by_tag_name | find_elements_by_tag_name | 通過標簽定位 |
find_element_by_class_name | find_elements_by_class_name | 通過類名進行定位 |
find_elements_by_css_selector | find_elements_by_css_selector | 通過css選擇器進行定位 |
**實例演示: ** 找到百度首頁的輸入框
from selenium import webdriver driver = webdriver.Chrome() driver.get('https://www.baidu.com') driver.find_element_by_id('kw')
需引入By模塊
from selenium import webdriver from selenium.webdriver.common.by import By driver = webdriver.Chrome() driver.get('https://www.baidu.com') driver.find_element(By.ID, 'kw')
方法 | 解釋 |
---|---|
click() | 點擊某個元素 |
send_keys(輸入的值) | 模擬輸入 |
clear() | 清除操作 |
submit() | 提交表單 |
get_attribute(name) | 獲取元素的屬性值 |
location | 獲取元素的位置 |
text | 獲取元素的文本值 |
size | 獲取元素的大小 |
id | 獲取元素的id值 |
tag_name | 獲取元素的標簽名 |
**實例演示: **在百度輸入框中輸入我是autofelix,并點擊搜索按鈕
from selenium import webdriver driver = webdriver.Chrome() driver.get('https://www.baidu.com') driver.find_element_by_id('kw').send_keys('我是autofelix') driver.find_element_by_id('su').click()
from selenium import webdriver driver = webdriver.Chrome() driver.maximize_window() driver.get('https://www.baidu.com') js_sql = ''' document.getElementById('kw').value = '我是autofelix' ''' driver.execute_script(js_sql)
網頁中frame的話,需要執行切入切出操作<br>
switch_to.from(子iframe的id名稱) 切入<br>
switch_to.parent_frame(父iframe的id名稱) 切出<br>
from selenium import webdriver driver = webdriver.Chrome() driver.maximize_window() driver.get('https://www.baidu.com') //這個網址并沒有iframe,我臆測有,你們看看就行 driver.switch_to.frame('我臆測出來的iframe')
方法 | 說明 |
---|---|
delete_all_cookies() | 刪除當前頁面所有cookies |
get_cookie(name) | 獲取指定cookie值 |
get_cookies() | 獲取當前頁面所有cookies值 |
add_cookie() | 設置cookie值 |
from selenium import webdriver driver = webdriver.Chrome() driver.maximize_window() driver.get('https://www.baidu.com') driver.delete_all_cookies() driver.add_cookie({'name': 'name', 'domain': '.baidu.com', 'value': 'autofelix'})
方法 | 解釋 |
---|---|
window_handles | 保存所有選項卡的元組 |
switch_to.window() | 切換選項卡 |
from selenium import webdriver driver = webdriver.Chrome() driver.maximize_window() driver.get('https://www.baidu.com') driver.get('https://www.taobao.com') driver.switch_to.window(driver.window_handles[0]) driver.switch_to.window(driver.window_handles[1])
鼠標事件需要引入ActionChains模塊
| 方法 | 說明 | | :--- | :--- | | move_to_element(above) | 鼠標右擊 | | double_click() | 鼠標雙擊 | | drag_and_drop() | 左鍵按住拖動 | | perform() | 動作存儲 |
**實例演示: **滑動滑塊驗證碼
from selenium import webdriver from selenium.webdriver import ActionChains from selenium.webdriver.common.by import By from selenium.webdriver.support.wait import WebDriverWait from selenium.webdriver.support import expected_conditions as EC # 初始化谷歌瀏覽器 driver = webdriver.Chrome() # 最大化窗口 driver.maximize_window() # 打開頭條登陸網址 driver.get('https://sso.toutiao.com') # 等待某個元素是否出現 WebDriverWait(self.driver, 10).until( EC.text_to_be_present_in_element((By.XPATH, '//*[@id="mobile-code-get"]/span'), u'發送') ) # 實例化鼠標操作 action = ActionChains(self.driver) # 按住滑塊 action.click_and_hold(self.driver.find_element_by_xpath('//*[@id="captcha_container"]')).perform() # 將滑塊移動x的距離 action.move_by_offset(xoffset=x, yoffset=0).perform() # 釋放滑塊 action.release().perform()
隱氏等待
如果到一定時間,指定的元素還沒有出現,進程不會阻塞,但是到指定時間還沒有找到,就會拋出異常
from selenium import webdriver driver = webdriver.Chrome() driver.implicitly_wait(10) driver.get('https://www.baidu.com')
顯示等待
如果在一定時間內,指定的元素沒有出現,進程會阻塞在這里,如果到指定時間還沒有找到,就會拋出異常
from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC driver = webdriver.Chrome() driver.implicitly_wait(10) driver.get('https://www.baidu.com') WebDriverWait(driver, 10).until( EC.presence_of_element_located((By.ID, 'kw')) )
back 后退<br>
forward 前進<br>
refresh 刷新瀏覽器<br>
from selenium import webdriver driver = webdriver.Chrome() driver.get('https://www.baidu.com') driver.get('https://www.taobao.com') driver.get('https://www.jd.com') driver.back() driver.forward() driver.refresh()
close 關閉當前標簽頁<br>
quit 關閉整個瀏覽器<br>
from selenium import webdriver driver = webdriver.Chrome() driver.get('https://www.baidu.com') //打開百度頁面后,關閉整個瀏覽器 driver.quit()
到此,關于“怎么使用python庫selenium采集抖音數據”的學習就結束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續學習更多相關知識,請繼續關注億速云網站,小編會繼續努力為大家帶來更多實用的文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。