中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么使用python庫selenium采集抖音數據

發布時間:2021-11-23 16:21:42 來源:億速云 閱讀:866 作者:iii 欄目:大數據

這篇文章主要介紹“怎么使用python庫selenium采集抖音數據”,在日常操作中,相信很多人在怎么使用python庫selenium采集抖音數據問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”怎么使用python庫selenium采集抖音數據”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!

一、安裝selenium

pip install Selenium

二、初始化瀏覽器

  • Chrome 是初始化谷歌瀏覽器

  • Firefox 是初始化火狐瀏覽器

  • Edge 是初始化IE瀏覽器

  • PhantomJS 是一個無界面瀏覽器。

from selenium import webdriver
 
driver = webdriver.Chrome()

三、設置瀏覽器大小

  •  maximize_window 最大化窗口

  • set_window_size 自定義窗口大小

from selenium import webdriver
 
driver = webdriver.Chrome()
driver.maximize_window()

四、訪問頁面

from selenium import webdriver
 
driver = webdriver.Chrome()
 
driver.get('https://www.baidu.com')

五、定位元素

  • 定位元素的基本方法如下

定位一個元素定位多個元素解釋
find_element_by_idfind_elements_by_id通過元素id定位
find_element_by_namefind_elements_by_name通過元素name定位
find_element_by_xpathfind_elements_by_xpath通過xpath表達式定位
find_element_by_link_textfind_elements_by_link_tex通過完整超鏈接定位
find_element_by_partial_link_textfind_elements_by_partial_link_text通過部分鏈接定位
find_element_by_tag_namefind_elements_by_tag_name通過標簽定位
find_element_by_class_namefind_elements_by_class_name通過類名進行定位
find_elements_by_css_selectorfind_elements_by_css_selector通過css選擇器進行定位
  • **實例演示: ** 找到百度首頁的輸入框

from selenium import webdriver
 
driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
driver.find_element_by_id('kw')

六、定位元素的另一種寫法

  • 需引入By模塊

from selenium import webdriver
from selenium.webdriver.common.by import By
 
driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
driver.find_element(By.ID, 'kw')

七、元素交互

方法解釋
click()點擊某個元素
send_keys(輸入的值)模擬輸入
clear()清除操作
submit()提交表單
get_attribute(name)獲取元素的屬性值
location獲取元素的位置
text獲取元素的文本值
size獲取元素的大小
id獲取元素的id值
tag_name獲取元素的標簽名
  • **實例演示: **在百度輸入框中輸入我是autofelix并點擊搜索按鈕

from selenium import webdriver
 
driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
driver.find_element_by_id('kw').send_keys('我是autofelix')
driver.find_element_by_id('su').click()

八、執行js

from selenium import webdriver
 
driver = webdriver.Chrome()
driver.maximize_window()
 
driver.get('https://www.baidu.com')
 
js_sql = '''
    document.getElementById('kw').value = '我是autofelix'
'''
driver.execute_script(js_sql)

九、Frame操作

  • 網頁中frame的話,需要執行切入切出操作<br>

  • switch_to.from(子iframe的id名稱) 切入<br>

  • switch_to.parent_frame(父iframe的id名稱) 切出<br>

from selenium import webdriver
 
driver = webdriver.Chrome()
driver.maximize_window()
 
driver.get('https://www.baidu.com')
 
//這個網址并沒有iframe,我臆測有,你們看看就行
driver.switch_to.frame('我臆測出來的iframe')

十、cookie的操作

方法說明
delete_all_cookies()刪除當前頁面所有cookies
get_cookie(name)獲取指定cookie值
get_cookies()獲取當前頁面所有cookies值
add_cookie()設置cookie值
from selenium import webdriver
 
driver = webdriver.Chrome()
driver.maximize_window()
 
driver.get('https://www.baidu.com')
 
driver.delete_all_cookies()
driver.add_cookie({'name': 'name', 'domain': '.baidu.com', 'value': 'autofelix'})

十一、選項卡管理

方法解釋
window_handles保存所有選項卡的元組
switch_to.window()切換選項卡
from selenium import webdriver
 
driver = webdriver.Chrome()
driver.maximize_window()
 
driver.get('https://www.baidu.com')
driver.get('https://www.taobao.com')
 
driver.switch_to.window(driver.window_handles[0])
driver.switch_to.window(driver.window_handles[1])

十二、鼠標事件

  • 鼠標事件需要引入ActionChains模塊 | 方法 | 說明 | | :--- | :--- | | move_to_element(above) | 鼠標右擊 | | double_click() | 鼠標雙擊 | | drag_and_drop() | 左鍵按住拖動 | | perform() | 動作存儲 |

  • **實例演示: **滑動滑塊驗證碼

from selenium import webdriver
from selenium.webdriver import ActionChains
from selenium.webdriver.common.by import By
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
 
# 初始化谷歌瀏覽器
driver = webdriver.Chrome()
 
# 最大化窗口
driver.maximize_window()
 
# 打開頭條登陸網址
driver.get('https://sso.toutiao.com')
 
# 等待某個元素是否出現
WebDriverWait(self.driver, 10).until(
    EC.text_to_be_present_in_element((By.XPATH, '//*[@id="mobile-code-get"]/span'), u'發送')
)
 
# 實例化鼠標操作
action = ActionChains(self.driver)
 
# 按住滑塊
action.click_and_hold(self.driver.find_element_by_xpath('//*[@id="captcha_container"]')).perform()
 
# 將滑塊移動x的距離
action.move_by_offset(xoffset=x, yoffset=0).perform()
 
# 釋放滑塊
action.release().perform()

十三、等待

  • 隱氏等待

  • 如果到一定時間,指定的元素還沒有出現,進程不會阻塞,但是到指定時間還沒有找到,就會拋出異常

from selenium import webdriver
 
driver = webdriver.Chrome()
driver.implicitly_wait(10)
 
driver.get('https://www.baidu.com')
  • 顯示等待

  • 如果在一定時間內,指定的元素沒有出現,進程會阻塞在這里,如果到指定時間還沒有找到,就會拋出異常

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
 
driver = webdriver.Chrome()
driver.implicitly_wait(10)
 
driver.get('https://www.baidu.com')
WebDriverWait(driver, 10).until(
    EC.presence_of_element_located((By.ID, 'kw'))
)

十四、前進、后退和刷新

  • back 后退<br>

  • forward 前進<br>

  • refresh 刷新瀏覽器<br>

from selenium import webdriver
 
driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
driver.get('https://www.taobao.com')
driver.get('https://www.jd.com')
 
driver.back()
driver.forward()
driver.refresh()

十五、關閉瀏覽器

  • close 關閉當前標簽頁<br>

  • quit 關閉整個瀏覽器<br>

from selenium import webdriver
 
driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
//打開百度頁面后,關閉整個瀏覽器
driver.quit()

到此,關于“怎么使用python庫selenium采集抖音數據”的學習就結束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續學習更多相關知識,請繼續關注億速云網站,小編會繼續努力為大家帶來更多實用的文章!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

西贡区| 霍城县| 江华| 巴楚县| 万荣县| 建昌县| 南陵县| 图片| 宝兴县| 正阳县| 临猗县| 九寨沟县| 樟树市| 福鼎市| 巴青县| 庆元县| 龙里县| 体育| 英山县| 湟源县| 余姚市| 洛扎县| 绥德县| 原平市| 桃园县| 海淀区| 盐源县| 措勤县| 华坪县| 封开县| 衡东县| 全南县| 武宁县| 隆尧县| 岑溪市| 阳谷县| 介休市| 神农架林区| 铜梁县| 嵊州市| 阿克陶县|