在Python中,我們可以使用pandas
庫的merge()
函數來合并兩個表。
merge()
函數的語法為:pandas.merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=('_x', '_y'), copy=True, indicator=False, validate=None)
其中,left
和right
參數是要合并的兩個表,how
參數指定了合并方式,on
參數指定了要合并的列名,left_on
和right_on
參數分別指定了左右兩個表要合并的列名,left_index
和right_index
參數分別指定了左右兩個表是否使用索引作為合并的鍵。
下面是一個示例,假設我們有兩個表df1
和df2
:
import pandas as pd
# 創建示例表 df1 和 df2
df1 = pd.DataFrame({'id': [1, 2, 3], 'name': ['Alice', 'Bob', 'Charlie']})
df2 = pd.DataFrame({'id': [1, 2, 4], 'age': [20, 25, 30]})
# 使用 merge() 函數合并兩個表
merged_df = pd.merge(df1, df2, on='id', how='inner')
print(merged_df)
輸出結果為:
id name age
0 1 Alice 20
1 2 Bob 25
在上述示例中,我們使用merge()
函數將df1
和df2
兩個表按照id
列進行合并,合并的方式為內連接(inner
)。最終得到的合并結果為包含了id
、name
和age
三列的新表merged_df
。