以下是一個使用C#實現的簡單爬蟲程序:
using System;
using System.Net;
class Program
{
static void Main(string[] args)
{
string url = "https://www.example.com"; // 要爬取的網頁地址
WebClient client = new WebClient();
string html = client.DownloadString(url); // 下載網頁內容
// 在這里對html進行解析和處理,提取需要的信息
Console.WriteLine(html); // 輸出網頁內容
}
}
上述程序使用WebClient
類來下載指定網頁的內容,并將內容存儲在字符串變量html
中。你可以在其后添加解析和處理HTML內容的代碼,提取出你感興趣的信息。最后,使用Console.WriteLine
方法將網頁內容輸出到控制臺。
請注意,爬取網頁的行為可能會受到網站的限制,使用爬蟲程序時請遵守相關法律法規和網站的使用條款。