python爬蟲從網頁上獲取源碼的示例

發布時間：2020-11-19 09:49:59 來源：億速云閱讀：364 作者：小新欄目：編程語言

這篇文章給大家分享的是有關python爬蟲從網頁上獲取源碼的示例的內容。小編覺得挺實用的，因此分享給大家做個參考。一起跟隨小編過來看看吧。

直接上代碼：

import requests
 s = requests.session()
 url = "http://www.baidu.com"
 data = s.get(url)
 with open("baidu.txt","w+",encoding='UTF-8') as f:
     f.write(data.content.decode("utf-8"))

import requests 把這個工具箱拿過來。
s = requests.session() 其中的一個工具取個短名，就叫s。
url = "http://www.baidu.com" 這是我們要測試的地址，主要http://不能省。用雙引號包起來說明是個字符串。
data = s.get(url) s.get(url)就是讓程序去訪問網站，拿到源碼了，拿到的源碼命名為data。
with open("baidu.txt","w+",encoding='UTF-8') as f:

源碼拿到了我們又看不見，很抽象，很難受，我當時是喜歡把它們寫到文檔里再研究；所以創建個baidu.txt（用完整的路徑也行）的文檔，w+模式打開，文件編碼是UTF-8，告訴程序這個文件里面寫的是中文，不是俄語。as f，讓這個文件打開后代號為f，對f的操作就是對文件的操作。

f.write(data.content.decode("utf-8")) 對f執行write操作，寫入的內容是獲取的源碼data中的content；

data是requests.Session.get返回的一整坨東西，是一個結構體，不是能寫入文本文件的字符串，所以要用里面的content。.decode("utf-8") 意思是把鳥語翻譯成格式為”utf-8”中文再寫進去。

這些代碼可以直接復制到Python Console回車就可以執行；會再py文件所在路徑或者你自己設定的baidu.txt的路徑生成一個baidu.txt的文件；打開就可以看到源碼。

python爬蟲從網頁上獲取源碼的示例

感謝各位的閱讀！關于python爬蟲從網頁上獲取源碼的示例就分享到這里了，希望以上內容可以對大家有一定的幫助，讓大家可以學到更多知識。如果覺得文章不錯，可以把它分享出去讓更多的人看到吧！

向AI問一下細節

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

python爬蟲從網頁上獲取源碼的示例

猜你喜歡

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

python爬蟲從網頁上獲取源碼的示例

猜你喜歡

最新資訊

相關推薦

相關標簽