在R語言中,可以通過使用dplyr包中的函數來實現高效的數據篩選與子集提取。以下是一些常用的dplyr函數:
下面是一個簡單的示例代碼,演示如何使用dplyr包來進行數據篩選與子集提取:
# 導入dplyr包
library(dplyr)
# 創建一個示例數據集
data <- data.frame(
id = 1:10,
name = c("Alice", "Bob", "Cathy", "David", "Emily", "Frank", "Grace", "Helen", "Ivy", "Jack"),
age = c(25, 30, 22, 28, 33, 27, 40, 35, 29, 26)
)
# 篩選出年齡大于30的數據
filtered_data <- data %>% filter(age > 30)
# 選擇數據集中的id和name列
selected_data <- data %>% select(id, name)
# 按照年齡對數據集進行降序排序
arranged_data <- data %>% arrange(desc(age))
# 新增一列計算年齡的平方
mutated_data <- data %>% mutate(age_squared = age^2)
# 對年齡進行匯總統計
summarised_data <- data %>% summarise(mean_age = mean(age), max_age = max(age))
# 打印結果
print(filtered_data)
print(selected_data)
print(arranged_data)
print(mutated_data)
print(summarised_data)
通過使用dplyr包中的函數,可以方便地進行高效的數據篩選與子集提取操作。