在R語言中進行情感分析和詞頻統計通常需要使用一些額外的包,例如tm和sentimentr。以下是一個簡單的示例代碼,可以進行情感分析和詞頻統計:
# 安裝和加載必要的包
install.packages("tm")
install.packages("sentimentr")
library(tm)
library(sentimentr)
# 創建一個文本向量
text <- c("這個電影非常好看,情節紵紵有致,演員表現也很出色。",
"這個餐廳的服務太差了,食物也不好吃。")
# 創建一個語料庫
corpus <- VCorpus(VectorSource(text))
# 進行文本預處理
corpus <- tm_map(corpus, content_transformer(tolower))
corpus <- tm_map(corpus, removePunctuation)
corpus <- tm_map(corpus, removeNumbers)
corpus <- tm_map(corpus, removeWords, stopwords("en"))
# 進行情感分析
sentiment <- sentiment(corpus)
# 輸出情感分析結果
print(sentiment$all)
# 進行詞頻統計
tdm <- TermDocumentMatrix(corpus)
freq <- rowSums(as.matrix(tdm))
freq <- subset(freq, freq > 0)
freq <- sort(freq, decreasing = TRUE)
# 輸出詞頻統計結果
print(freq)
這段代碼首先創建了一個包含兩個文本的向量,然后將其轉換為語料庫并進行文本預處理。接下來使用sentimentr包進行情感分析,并輸出結果。最后使用tm包中的TermDocumentMatrix函數進行詞頻統計,并輸出結果。
使用這段代碼可以很方便地進行情感分析和詞頻統計,可以根據實際需求對代碼進行進一步的修改和擴展。