Jsoup是一個開源的Java HTML解析器,可以通過選擇器語法來提取和操作HTML文檔。它提供了一種簡單、方便的方式來解析HTML并提取其中的數據。
以下是Jsoup的一些常用用法:
Document doc = Jsoup.parse(html);
Document doc = Jsoup.connect(url).get();
Elements links = doc.select("a");
Element element = doc.selectFirst("#id");
Elements elements = doc.select(".class");
String href = link.attr("href");
String text = link.text();
for (Element link : links) {
// do something
}
link.attr("href", "newUrl");
link.text("newText");
Elements forms = doc.select("form");
for (Element form : forms) {
String action = form.attr("action");
// do something
}
除了上述常用用法,Jsoup還提供了強大的功能,如處理文檔編碼、處理HTML片段、處理文件上傳等。可以通過查閱官方文檔來了解更多詳細用法:https://jsoup.org/