fillna函數在Python數據分析中的應用場景

fillna() 函數在 Python 數據分析中主要用于處理缺失值（NaN 或 None）

填充缺失值：當數據集中存在缺失值時，可以使用 fillna() 函數將這些缺失值替換為特定的值或者基于其他值計算出的值。例如，可以用0、平均值、眾數或中位數等填充缺失值。

import pandas as pd

# 創建一個包含缺失值的 DataFrame
data = {'A': [1, 2, None, 4], 'B': [None, 6, 7, 8]}
df = pd.DataFrame(data)

# 使用 fillna() 函數填充缺失值
filled_df = df.fillna(0)  # 將缺失值替換為 0

填充前向值或后向值：在時間序列數據中，可以使用 fillna() 函數填充缺失值，方法是使用前一個有效值（前向填充）或后一個有效值（后向填充）。

import pandas as pd

# 創建一個包含缺失值的時間序列數據
data = {'date': pd.date_range('2021-01-01', periods=5), 'value': [1, 2, None, 4, None]}
ts = pd.DataFrame(data).set_index('date')

# 使用 fillna() 函數進行前向填充和后向填充
ffilled_ts = ts.fillna(method='ffill')  # 前向填充
bfilled_ts = ts.fillna(method='bfill')  # 后向填充

根據條件填充：可以使用 fillna() 函數結合條件邏輯來填充缺失值。例如，可以根據某列的值來決定使用哪個值填充缺失值。

import pandas as pd

# 創建一個包含缺失值的 DataFrame
data = {'A': [1, 2, None, 4], 'B': [None, 6, 7, 8], 'C': [10, 20, 30, 40]}
df = pd.DataFrame(data)

# 使用 fillna() 函數根據條件填充缺失值
filled_df = df.fillna(df['C'] / 10)  # 將缺失值替換為 C 列對應值除以 10

總之，fillna() 函數在 Python 數據分析中具有廣泛的應用場景，可以幫助處理缺失值，從而提高數據質量和分析效果。

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

最新問答

相關標簽