您好,登錄后才能下訂單哦!
如何理解xHTML源碼的DLL組件AngleSharp,針對這個問題,這篇文章詳細介紹了相對應的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。
AngleSharp是基于.NET(C#)開發的專門為解析xHTML源碼的DLL組件。
項目地址:https://github.com/FlorianRappl/AngleSharp
我主要介紹是一些使用AngleSharp常用的方法,跟大家介紹,我會以億速云站點作為原型。 其它的類似組件有:
國內:Jumony
github地址: https://github.com/Ivony/Jumony
國外:Html Agility Pack
項目地址:http://htmlagilitypack.codeplex.com/
具體大家可以自行搜索對比三者的區別和性能。接下來咱們主要討論主角是AngleSharp
引入AngleSharp至項目,用NuGet工具執行命令(其實我是在裝逼。) Install-Package AngleSharp
在項目中添加引用Using AngleSharp
首先我們獲取CnBlogs首頁的HTML源代碼
static public string GetHtml() { HttpWebRequest myReq = (HttpWebRequest)WebRequest.Create("https://www.jb51.net"); HttpWebResponse response = (HttpWebResponse)myReq.GetResponse(); // Get the stream associated with the response. Stream receiveStream = response.GetResponseStream(); // Pipes the stream to a higher level stream reader with the required encoding format. StreamReader readStream = new StreamReader(receiveStream, Encoding.UTF8); return readStream.ReadToEnd(); }
獲取jb51首頁當前所有博客文章的標題
private static void Main(string[] args) { //找出所有文章標題 string cnblogsHtml = GetHtml(); //加載HTML var document = DocumentBuilder.Html(cnblogsHtml); //這里必須要使用== 不能使用Equals var titleItemList = document.All.Where(m => m.ClassName == "titlelnk"); int iIndex = 1; foreach (var element in titleItemList) { Console.WriteLine(iIndex + ":" + element.InnerHtml); iIndex++; } }
以上代碼輸出內容:
1:JNDI學習總結(三)——Tomcat下使用Druid配置JNDI數據源 2:我們前端是怎么跟設計師溝通的 3:MVC5+EF6 入門完整教程六 4:試議常用Javascript 類庫中 throttle 與 debounce 輔助函數的區別 5:孤獨的走過年輕 6:上周熱點回顧(11.10-11.16) 7:Android動畫-補間(Tween)動畫 8:樸素貝葉斯算法的python實現 9:MVC三層級聯方式 10:C# 標簽(條碼)的打印與設計(一) 11:OpenCASCADE Make Primitives-Box 12:基于solr實現hbase的二級索引 13:(十六)WebGIS中偏移補償量引發的問題之探討 14:javascript小游戲--生命游戲 15:Android動畫-幀動畫 16:C# Socket學習筆記一 17:lua表排序 18:ZooKeeper系列 第一篇:ZooKeeper快速入門 19:【插件開發】—— 9 編輯器代碼分塊著色-高亮顯示! 20:華盛頓大學計算機視覺課程筆記(一)
關于如何理解xHTML源碼的DLL組件AngleSharp問題的解答就分享到這里了,希望以上內容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關注億速云行業資訊頻道了解更多相關知識。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。