python3爬蟲中BeautifulSoup怎么用

發布時間：2021-09-08 11:51:54 來源：億速云閱讀：207 作者：小新欄目：編程語言

小編給大家分享一下python3爬蟲中BeautifulSoup怎么用，相信大部分人都還不怎么了解，因此分享這篇文章給大家參考一下，希望大家閱讀完這篇文章后大有收獲，下面讓我們一起去了解一下吧！

有些朋友覺得利用正則表達式提取信息太麻煩了。

有一個高效的網頁解析庫，它的名字叫做BeautifulSoup

它支持多種格式的解析，我們用的比較多的是lxml解析器

實例學習

html_doc = """
<html><head><title>學習python的正確姿勢</title></head>
<body>
<p class="title"><b>小帥b的故事</b></p>
<p class="story">有一天，小帥b想給大家講兩個笑話
<a href="http://example.com/1" class="sister" id="link1">一個笑話長</a>,
<a href="http://example.com/2" class="sister" id="link2">一個笑話短</a> ,
他問大家，想聽長的還是短的？</p>

<p class="story">...</p>
導入庫,將 html 的源代碼傳給 BeautifulSoup
from bs4 import BeautifulSoup
soup=BeautifulSoup(html_doc,"lxml")
打印title標簽內容
print(soup.title.string)
打印p標簽內容,只打印了第一個

print(soup.p.string)
打印title標簽的父親標簽

print(soup.title.parent.name)
打印a標簽,只打印了第一個

print(soup.a)
使用soup.find方法
打印id為link2的標簽

print(soup.find(id="link2"))
getText獲取全部內容

print(soup.getText)
select法
除了find方法之外如果你對css比較熟悉也可以使用 select 方法

打印title標簽

print(soup.select("title"))#
打印body標簽

print(soup.select("body a"))
打印p標簽中,id為link1的那一個
print(soup.select("p #link1"))

以上是“python3爬蟲中BeautifulSoup怎么用”這篇文章的所有內容，感謝各位的閱讀！相信大家都有了一定的了解，希望分享的內容對大家有所幫助，如果還想學習更多知識，歡迎關注億速云行業資訊頻道！

向AI問一下細節

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

python3爬蟲中BeautifulSoup怎么用

猜你喜歡

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

python3爬蟲中BeautifulSoup怎么用

猜你喜歡

最新資訊

相關推薦

相關標簽