中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

golang中怎么抓取網頁并分析頁面包含的鏈接

發布時間:2021-07-06 15:44:52 來源:億速云 閱讀:427 作者:Leah 欄目:編程語言

golang中怎么抓取網頁并分析頁面包含的鏈接,相信很多沒有經驗的人對此束手無策,為此本文總結了問題出現的原因和解決方法,通過這篇文章希望你能解決這個問題。

1. 下載非標準的包,"golang.org/x/net/html"

2. 先安裝git,使用git命令下載

git clone https://github.com/golang/net

3. 將net包,放到GOROOT路徑下

比如:

我的是:GOROOT = E:\go\

所以最終目錄是:E:\go\src\golang.org\x\net

注意:如果沒有golang.org和x文件夾,就創建

4. 創建fetch目錄,在其下創建main.go文件,main.go文件代碼內容如下:

package main
 
import (
 "os"
 "net/http"
 "fmt"
 "io/ioutil"
)
 
func main() {
 for _, url := range os.Args[1:] {
 resp, err := http.Get(url)
 if err != nil {
  fmt.Fprintf(os.Stderr, "fetch: %v\n", err)
 }
 b, err := ioutil.ReadAll(resp.Body)
 resp.Body.Close()
 if err != nil {
  fmt.Fprintf(os.Stderr, "fetch: reading %s: %v\n", url, err)
  os.Exit(1)
 }
 fmt.Printf("%s",b)
 }
}

5. 編譯fetch

go build test.com\justin\demo\fetch

注意:test.com\justin\demo\ 是我的項目路徑,具體編譯根據自己項目路徑編譯。

6. 執行fetch.exe 文件

fetch.exe https://www.qq.com

注意:https://www.qq.com是要爬的網址,配置正確的話,會打印出網址的HTML內容。如果沒有,請檢查以上步驟是否正確。

7. 網頁已經抓取了,那么剩下就分析頁面包含的鏈接了,創建findlinks目錄,在其下創建main.go文件,main.go文件代碼內容如下:

package main
 
import (
 "os"
 "fmt"
 "golang.org/x/net/html"
)
 
func main() {
 doc, err := html.Parse(os.Stdin)
 if err != nil {
 fmt.Fprint(os.Stderr, "findlinks: %v\n", err)
 os.Exit(1)
 }
 for _, link := range visit(nil, doc) {
 fmt.Println(link)
 }
}
 
func visit(links []string, n *html.Node) []string {
 if n.Type == html.ElementNode && n.Data == "a" {
 for _, a := range n.Attr {
  if a.Key == "href" {
  links = append(links, a.Val)
  }
 }
 }
 for c := n.FirstChild; c != nil; c = c.NextSibling {
 links = visit(links, c)
 }
 return links
}

8. 編譯findlinks

go build test.com\justin\demo\findlinks

注意:test.com\justin\demo\ 是我的項目路徑,具體編譯根據自己項目路徑編譯。

9. 執行findlinks.exe 文件

fetch.exe https://www.qq.com | findlinks.exe

> 10. 執行后結果:獲取到各種不同形式的超鏈接

看完上述內容,你們掌握golang中怎么抓取網頁并分析頁面包含的鏈接的方法了嗎?如果還想學到更多技能或想了解更多相關內容,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

喀喇沁旗| 砚山县| 额敏县| 远安县| 沂南县| 怀集县| 苍南县| 汝阳县| 长泰县| 犍为县| 镇平县| 工布江达县| 柘城县| 库车县| 黄梅县| 裕民县| 桦甸市| 如东县| 大兴区| 桃园县| 灵寿县| 金山区| 遵义县| 南溪县| 鲁山县| 涡阳县| 普兰店市| 朔州市| 库尔勒市| 志丹县| 郯城县| 宝坻区| 锦屏县| 亳州市| 临夏市| 社旗县| 中西区| 宜都市| 江华| 黄浦区| 常德市|