Ubuntu怎么實現詞頻統計

發布時間：2022-11-14 10:51:21 來源：億速云閱讀：186 作者：iii 欄目：服務器

這篇文章主要介紹了Ubuntu怎么實現詞頻統計的相關知識，內容詳細易懂，操作簡單快捷，具有一定借鑒價值，相信大家閱讀完這篇Ubuntu怎么實現詞頻統計文章都會有所收獲，下面我們一起來看看吧。

Ubuntu實現詞頻統計的示例：

使用shell實現簡單的詞頻統計，例如：統計如下中第二列單詞出現的次數。

1,huabingood,100

2,haha,200

3,huabingood,300

4,haha,100

5,haha,200

實現代碼命令：

cat a.txt | awk -F "," '{print $2}' | sort | uniq -c | sort -nrk 1

代碼解釋：

awk -F "," '{print $2}' # 將數據按照逗號進行分割，并取出第二列的內容

sort　　# 將取出的內容進行排序。因為uniq統計時，如果重復的數據不連續，就會被認為時兩個不同內容的行

uniq -c　　# 統計重復行出現的次數

sort -nrk 1　　# 按照第一列重復的次數，按照數字順序進行降序排列

關于“Ubuntu怎么實現詞頻統計”這篇文章的內容就介紹到這里，感謝各位的閱讀！相信大家對“Ubuntu怎么實現詞頻統計”知識都有一定的了解，大家如果還想學習更多知識，歡迎關注億速云行業資訊頻道。

向AI問一下細節

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站