您好,登錄后才能下訂單哦!
這篇文章給大家分享的是有關基于python實現微信好友數據分析的方法的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。
本文主要介紹利用網頁端微信獲取數據,實現個人微信好友數據的獲取,并進行一些簡單的數據分析,功能包括:
1.爬取好友列表,顯示好友昵稱、性別和地域和簽名, 文件保存為 xlsx 格式
2.統計好友的地域分布,并且做成詞云和可視化展示在地圖上
1、Pyecharts:一個用于生成echarts圖表的類庫,echarts是百度開源的一個數據可視化庫,用echarts生成的圖可視化效果非常棒,使用pyechart庫可以在python中生成echarts數據圖。
2、Itchat:一個開源的微信個人號接口,使用python調用微信從未如此簡單。
3、Jieba:簡單的分詞操作庫。
4、Numpy:NumPy 系統是 Python 的一種開源的數值計算擴展。這種工具可用來存儲和處理大型矩 陣。
5、Pandas:pandas 是基于 NumPy 的一種工具,該工具是為了解決數據分析任務而創建的。
6、Pillow:圖像處理。
7、wxpy:wxpy 在 itchat 的基礎上,通過大量接口優化提升了模塊的易用性,并進行豐富的功能 擴展。 (微信本身提供)
注:Pyecharts可能安裝0.5.*的版本比較好
以上的三方庫可以通過命令符(cmd)來實現安裝,具體命令:pip install ***
from wxpy import * #導入模塊 bot = Bot(cache_path=True) #初始化機器人,選擇掃碼登錄 friend_all = bot.friends() #獲取微信好友信息
首先出現的是一張二維碼,然后掃描登錄
成功登錄好了就是這種顯示
之后就可以進行操作了,好友數量,個人信息
print(len(friend_all)) #好友的數量 print(friend_all[0].raw) #輸出個人信息
顯示的結果
四、接下來把全部的好友信息轉化為一個xlsx文件
獲取全部好友信息
for a_friend in friend_all: NickName = a_friend.raw.get('NickName', None) #昵稱 #Sex = a_friend.raw.get('Sex', None) Sex = {1: "男", 2: "女", 0: "其它"}.get(a_friend.raw.get('Sex', None), None) #性別(優化) City = a_friend.raw.get('City', None) #城市 Province = a_friend.raw.get('Province', None) #省份 Signature = a_friend.raw.get('Signature', None) #個性簽名 HeadImgUrl = a_friend.raw.get('HeadImgUrl', None) #頭像地址 HeadImgFlag = a_friend.raw.get('HeadImgFlag', None) #小Flag list_0=[NickName, Sex, City, Province, Signature, HeadImgUrl, HeadImgFlag] #存為一維數組 lis.append(list_0) #疊加數據
存為xlsx文件
def list_excel(filename,lis): ''' 將列表寫入excel中,其中列表中的元素是列表. filename:保存的文件名(含路徑) lis:元素為列表的列表,如下: lis = [["名稱", "價格", "出版社", "語言"], ["暗時間", "32.4", "人民郵電出版社", "中文"], ["拆掉思維里的墻", "26.7", "機械工業出版社", "中文"]] ''' import openpyxl wb = openpyxl.Workbook() #激活worksheet sheet = wb.active sheet.title = 'sheet1' #創建一個表格 file_name = filename +'.xlsx' for i in range(0, len(lis)): for j in range(0, len(lis[i])): sheet.cell(row=i+1, column=j+1, value=str(lis[i][j])) #每行每列的存入數據 wb.save(file_name) print("寫入數據成功!") list_excel('wechat',lis)
效果如下:
可以看到其好友基本分布再廣東省,個性簽名也是非常的殺馬特
五、實現詞云圖(我們也可以從存儲在本地的 excel 中讀取數據進行分析,并查看數據形式。在執行以 下代碼之前,我們需要先把 excel 文件加一個列標題行)
例如nickname sex city province signature headImgUrl headImgFlag
#導入模塊 from wordcloud import WordCloud import matplotlib.pyplot as plt import pandas as pd from pandas import DataFrame word_list= df['city'].fillna('0').tolist() #將 dataframe 的列轉化為 list,其中的 nan 用“0”替換 new_text = ' '.join(word_list) wordcloud = WordCloud(font_path='simhei.ttf', background_color="black").generate(new_text) #設計圖背景顏色,字體 plt.imshow(wordcloud) plt.axis("off") plt.show()
還可以將詞云圖存為HTML形式
#利用 pyechart 做詞云 import pandas as pd #count = df.city.value_counts() #對 dataframe 進行全頻率統計,排除了 nan city_list = df['city'].fillna('NAN').tolist()#將 dataframe 的列轉化為 list,其中的 nan 用“NAN” 替換 count_city = pd.value_counts(city_list)#對 list 進行全頻率統計 from pyecharts.charts.wordcloud import WordCloud #設置對象 name = count_city.index.tolist() value = count_city.tolist() wordcloud = WordCloud(width=1300, height=620) wordcloud.add("", name, value, word_size_range=[20, 100]) wordcloud.show_config() wordcloud.render(r'D:\python\wechatcloud.html')
再看看效果:
六、轉化為地圖形式
注:安裝地圖數據包:pip install echarts-china-provinces-pypkg pip install echarts-countries-pypkg
province_list = df['province'].fillna('NAN').tolist() #將 dataframe 的列轉化為 list,其中的 nan 用 “NAN”替換 count_province = pd.value_counts(province_list) #對 list 進行全頻率統計 from pyecharts import Map value =count_province.tolist() attr =count_province.index.tolist() map=Map("各省微信好友分布", width=1300, height=700) map.add("", attr, value, maptype='china', is_visualmap=True,visual_text_color='#000',is_label_show = True) #顯示地圖上的省份 map.show_config() map.render(r'D:\python\wechatProMap.html')
效果:
感謝各位的閱讀!關于“基于python實現微信好友數據分析的方法”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。