中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

python中怎么獲取標題和鏈接

發布時間:2021-07-28 17:48:19 來源:億速云 閱讀:297 作者:Leah 欄目:大數據

本篇文章給大家分享的是有關python中怎么獲取標題和鏈接,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

先上代碼

from requests_html import HTMLSession
session = HTMLSession()
url = "https://my.oschina.net/u/4798232"r = session.get(url)for i in range(1, 12):
    i = str(i)
    urlxpath = '//*[@id="newestBlogList"]/div[1]/div['+i+']/div/a'    bt = r.html.xpath(urlxpath, first=True).text
    c = urlxpath+'/@href'    link = r.html.xpath(c, first=True)
    a = "原"    if bt.find(a) == -1:print(bt)print(link)else:print(bt.replace(a, ""))print(link)

首先呢,這個是通過xpath來進行操作的,具體如何復制xpath可以看我的https://zjzdmc.top/jsfx/47.html這篇文章,里面有動圖。

然后導入什么庫啥的,都是老生常談的了,在a標簽中,你復制的xpath為//*[@id="newestBlogList"]/div[1]/div['+i+']/div/a這個,然后呢,我們獲取標題的話,加上.text這個屬性,就會變成文字了,而其中的文字我們可以看f12內的內容,發現其實只有標題,而我們如果需要連接的話,只需要加上這個/@href即可獲取鏈接了。不過目前其實沒有找到更好的獲取所有文字序列的方法,所以我們直接看最前面的文章id和最后一篇文章的id,記錄下來即可。之后我們只需要遍歷一下1-12的值即可,然后給字符串添加變量的方法為字符串+變量+字符串即可'//*[@id="newestBlogList"]/div[1]/div['+i+']/div/a'如文字所示,即可獲取所有文章的標題了,然后給之前定義的變量urlxpath后面添加上/@href后,即可獲取改xpath內的鏈接了,之后輸出即可了。

以上就是python中怎么獲取標題和鏈接,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

辽中县| 隆尧县| 沙坪坝区| 清水河县| 肇源县| 安泽县| 镇赉县| 宝山区| 铜山县| 靖宇县| 巴楚县| 嫩江县| 灵山县| 冀州市| 清河县| 吉林市| 巫溪县| 林周县| 东丽区| 宣武区| 望都县| 阿图什市| 郯城县| 怀集县| 攀枝花市| 中卫市| 昌宁县| 县级市| 重庆市| 四川省| 杭州市| 通州区| 平乡县| 茂名市| 望奎县| 邢台县| 荔浦县| 克山县| 惠水县| 菏泽市| 会理县|