中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何使用Python導出并分析聊天記錄

發布時間:2022-02-18 17:06:15 來源:億速云 閱讀:389 作者:小新 欄目:開發技術

這篇文章主要介紹了如何使用Python導出并分析聊天記錄,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。

導出聊天記錄生成詞云看看你和對象聊了什么

1.導出聊天記錄打開消息管理器

如何使用Python導出并分析聊天記錄

導出的格式選擇txt格式(我這里選擇導出的路徑是桌面所以在桌面上生成了一個包含聊天記錄的.txt文件)

如何使用Python導出并分析聊天記錄

2.編寫代碼圖中框出來的文本是我們不需要的(比如說圖片會在這里面顯示為[圖片]表情顯示為[表情]) 所以我們把它替換掉,我這里用到了正則:

如何使用Python導出并分析聊天記錄

string = open(r'C:\\Users\\l1768\\Desktop\\消息記錄.txt','r',encoding='utf-8').read()
s = re.compile('2020.+洋仔|2020.+?﹏?? 大大大威鍋丶|表情|圖片|2019.+洋仔|2019.+?﹏?? 大大大威鍋丶|撤回了一條消息|系統消息')#編寫正則表達式
message = re.sub(s,'',string)#替換對應的字符串為空字符串

然后我們把經過處理的文本再進行去除特殊字符處理

def getText(text):#該函數用來替換文本中出現的特殊字符
txt = text
for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~,。、 :':
txt = txt.replace(ch, "")   #將文本中特殊字符替換為空格
return txt
message = getText(message)

使用jieba分詞并生成詞云

split_message = jieba.lcut(message)
wordcloud_txt = ' '.join(split_message)
w=wordcloud.WordCloud(background_color="white", 
font_path='./fonts/simhei.ttf',
width=1600,height=800,
max_words=2000)#設置生成詞云的參數,background_color指定圖片背景顏色,
#font_path設置中文字體,要不然中文會顯示不出來
#width=1600,height=800分別指定圖片的寬度像素和高度像素,
#max_words指定生成詞云的詞最大是兩千詞
#還有很多可選參數,大家可以自行百度
w.generate(wordcloud_txt)#向詞云傳遞文本
w.to_file("聊天記錄詞云.png")#最后生成詞云的圖片

3.最終生成的結果:

如何使用Python導出并分析聊天記錄

4.完整代碼:

import re
import jieba
import wordcloud
def getText(text):#該函數用來替換文本中出現的特殊字符
txt = text
for ch in '!"#$%&()*+,-./:;<=>?@[\]^_‘{|}~,。、 :':
txt = txt.replace(ch, "") #將文本中特殊字符替換為空格
return txt
string = open(r'C:\Users\l1768\Desktop\消息記錄.txt','r',encoding='utf-8').read()
s = re.compile('2020.+洋仔|2020.+?﹏?? 大大大威鍋丶|表情|圖片|2019.+洋仔|2019.+?﹏?? 大大大威鍋丶|撤回了一條消息|系統消息')
message = re.sub(s,'',string)
message = getText(message)
split_message = jieba.lcut(message)
wordcloud_txt = ' '.join(split_message)
w=wordcloud.WordCloud(background_color="white", font_path='./fonts/simhei.ttf',width=1600,height=800,max_words=2000)#設置生成詞云的參數
w.generate(wordcloud_txt)#向詞云傳遞文本
w.to_file("聊天記錄詞云.png")#最后生成詞云的圖片

感謝你能夠認真閱讀完這篇文章,希望小編分享的“如何使用Python導出并分析聊天記錄”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業資訊頻道,更多相關知識等著你來學習!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

无极县| 离岛区| 犍为县| 什邡市| 应城市| 拉萨市| 绥芬河市| 营山县| 聂荣县| 疏附县| 长治县| 盘锦市| 建湖县| 那坡县| 淮阳县| 枝江市| 余江县| 铁力市| 东明县| 古田县| 大化| 达日县| 阳东县| 江阴市| 黔南| 新蔡县| 沈阳市| 郴州市| 麻阳| 三明市| 丹棱县| 晋中市| 湘阴县| 安岳县| 新乐市| 莲花县| 琼结县| 珲春市| 灵川县| 永善县| 辉县市|