python中怎么獲取標題和鏈接

發布時間：2021-07-28 17:48:19 來源：億速云閱讀：297 作者：Leah 欄目：大數據

本篇文章給大家分享的是有關python中怎么獲取標題和鏈接，小編覺得挺實用的，因此分享給大家學習，希望大家閱讀完這篇文章后可以有所收獲，話不多說，跟著小編一起來看看吧。

先上代碼

from requests_html import HTMLSession
session = HTMLSession()
url = "https://my.oschina.net/u/4798232"r = session.get(url)for i in range(1, 12):
    i = str(i)
    urlxpath = '//*[@id="newestBlogList"]/div[1]/div['+i+']/div/a'    bt = r.html.xpath(urlxpath, first=True).text
    c = urlxpath+'/@href'    link = r.html.xpath(c, first=True)
    a = "原"    if bt.find(a) == -1:print(bt)print(link)else:print(bt.replace(a, ""))print(link)

首先呢，這個是通過xpath來進行操作的，具體如何復制xpath可以看我的https://zjzdmc.top/jsfx/47.html這篇文章，里面有動圖。

然后導入什么庫啥的，都是老生常談的了，在a標簽中，你復制的xpath為//*[@id="newestBlogList"]/div[1]/div['+i+']/div/a這個，然后呢，我們獲取標題的話，加上.text這個屬性，就會變成文字了，而其中的文字我們可以看f12內的內容，發現其實只有標題，而我們如果需要連接的話，只需要加上這個/@href即可獲取鏈接了。不過目前其實沒有找到更好的獲取所有文字序列的方法，所以我們直接看最前面的文章id和最后一篇文章的id，記錄下來即可。之后我們只需要遍歷一下1-12的值即可，然后給字符串添加變量的方法為字符串+變量+字符串即可'//*[@id="newestBlogList"]/div[1]/div['+i+']/div/a'如文字所示，即可獲取所有文章的標題了，然后給之前定義的變量urlxpath后面添加上/@href后，即可獲取改xpath內的鏈接了，之后輸出即可了。

以上就是python中怎么獲取標題和鏈接，小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。

向AI問一下細節

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

python中怎么獲取標題和鏈接

猜你喜歡

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

python中怎么獲取標題和鏈接

猜你喜歡

最新資訊

相關推薦

相關標簽