中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

python怎么對文本進行詞頻統計

小億
123
2024-01-03 18:55:13
欄目: 編程語言

使用Python對文本進行詞頻統計可以使用下面的步驟:

  1. 打開文本文件并讀取文本內容。
with open("text.txt", "r") as file:
    text = file.read()
  1. 對文本進行分詞。
import re

# 去除標點符號和空白字符
text = re.sub(r'[^\w\s]', '', text)

# 將文本拆分為單詞列表
words = text.split()
  1. 統計每個單詞的出現次數。
from collections import Counter

word_count = Counter(words)
  1. 排序并輸出詞頻結果。
for word, count in word_count.most_common():
    print(word, count)

完整的代碼如下:

import re
from collections import Counter

with open("text.txt", "r") as file:
    text = file.read()

text = re.sub(r'[^\w\s]', '', text)
words = text.split()
word_count = Counter(words)

for word, count in word_count.most_common():
    print(word, count)

請確保將代碼中的"text.txt"替換為實際的文本文件路徑。

0
油尖旺区| 武安市| 兴国县| 井研县| 厦门市| 房产| 逊克县| 拉孜县| 土默特右旗| 中阳县| 台江县| 满城县| 永春县| 原阳县| 红桥区| 朝阳县| 赣榆县| 余江县| 济宁市| 万荣县| 朔州市| 灵丘县| 嘉峪关市| 高雄市| 毕节市| 弥渡县| 峨眉山市| 中山市| 博兴县| 松原市| 延长县| 漳州市| 肥乡县| 阿坝县| 沈阳市| 和硕县| 慈溪市| 寻甸| 邵阳市| 买车| 康乐县|