在Pandas中處理HTML數據,可以使用pd.read_html()
函數來將HTML表格數據讀取為DataFrame對象。這個函數將返回一個包含所有表格數據的列表,每個表格數據對應一個DataFrame對象。
以下是一個簡單的示例:
import pandas as pd
# 讀取網頁中的表格數據
url = 'https://en.wikipedia.org/wiki/List_of_countries_by_past_and_future_population'
tables = pd.read_html(url)
# 打印第一個表格數據
print(tables[0])
這樣就可以將網頁中的表格數據讀取為DataFrame對象,然后可以對數據進行進一步處理和分析。