R語言中subset函數用于從數據框中選擇需要的觀測值和變量,可以根據條件進行子集的選擇。其基本用法如下:
subset(data, subset, select)
示例:
# 從數據框df中選擇滿足條件的觀測值
new_df <- subset(df, subset = condition)
# 從數據框df中選擇滿足條件的觀測值,并選擇需要的變量
new_df <- subset(df, subset = condition, select = variables)
其中,condition
可以是一個邏輯向量,也可以是一個邏輯表達式,例如df$var > 10
表示選擇變量var
大于10的觀測值。variables
可以是一個字符向量,也可以是一個數值向量,例如c("var1", "var2")
表示選擇var1
和var2
這兩個變量。
需要注意的是,subset函數會在選擇變量時自動將結果轉換為數據框,因此返回的結果仍然是一個數據框。