您好,登錄后才能下訂單哦!
這篇文章主要介紹“Python+BI怎么爬取車厘子數據”,在日常操作中,相信很多人在Python+BI怎么爬取車厘子數據問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”Python+BI怎么爬取車厘子數據”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!
我在淘寶上用python爬取了3000條數據,然后導入到了FineBI中進行可視化分析,最終制作出了下面這樣一份可視化報告:
下面我展示一下操作過程:
一、數據獲取
用Python在淘寶上進行數據爬取是老生常談的操作了,直接在淘寶上搜索“車厘子”,在下面的商品頁中可以看到,我們這次主要爬取的標簽是“商品名稱”、“價格”、“付款人數”、“店鋪名稱”、“發貨地址”等:
按下F12,調出后臺查看源代碼,找到不同的商品標簽代碼,比如價格是“price g_price g_price-highlight">”,付款人數是“deal-cnt”等:
了解了網頁的代碼結構之后,下一步就可以在python里直接編寫代碼了,具體過程不詳細介紹了,部分代碼如下:
爬取完數據之后導入到Excel里,然后在Excel里經過簡單的數據清洗和處理,最終得到一份完成的數據表:
二、數據分析
python雖然也能實現數據分析的功能,但是需要敲代碼,學習成本和難度都比較大,不如直接利用專業的數據分析工具進行分析,比如常見的比如FineBI、Tableau、PowerBI等。
下面我直接以FineBI為例,FineBI是國內知名度比較高的本土數據分析工具,比起tableau這些國外工具最大的優點就是簡單、靈活,只需要用鼠標拖拽就能實現各種分析操作,基本不需要寫代碼,對新手非常友好。
其實FineBI本質上屬于企業級的業務數據分析平臺,除了數據分析之外,還能實現數據管理、數據平臺搭建等功能,這里就不詳細介紹了,大家感興趣的話我下一篇再介紹。
有了excel源表,首先我們將Excel導入到FineBI中:
然后直接點擊頁面左上角的“創建儀表板”,就可以進入到可視化后臺:
下一步進入到儀表板進行可視化操作,基本步驟是“選擇圖表類型——選擇指標和維度——拖拽到指定坐標軸——美化細節”,比如我想要創建一張可視化地圖,首先要先選擇圖表類型為“區域地圖”,然后要選擇指標和維度,但是原數據表里沒有地理緯度,因此需要自己創建:
最后,我們再拖拽到指定坐標軸,然后美化細節就可以完成一張可視化地圖了:
以此類推,其他的可視化圖表也能夠按照我們自己的需求進行制作,這里不詳細講了。
三、數據可視化
1、車厘子銷量分布情況
可以看出來國內車厘子最大的銷量來自上海,以及浙江、廣東兩省,西藏、青海、內蒙古等省份都沒有銷量,基本上來說沿海地區的銷量要高于內陸。
2、各省份銷量情況
通過條形圖就更明顯了,上海的銷量有20多萬,幾乎是浙江、廣東、四川的總和。
3、各城市的銷量情況
篩選出了銷量前十的城市,以及每個城市平均的車厘子價格,可以看出來上海的銷量和價格都是最高的,可以看出上海的購買力有多強了;
4、車厘子的價格區間情況
數據表里將價格區間分為“50以下”、“50-100”、“100-150”、“150-200”、“200-500”、“500以上”等,可以看出來占比最大的價格區間是“50-100”,這應該屬于平民價格了;值得注意的是“200-500”的價格占比也高于“100-150”。
5、各門店的銷量與價格情況
可以看出銷量最高的基本都是旗艦店,最高的平均價格基本在600-800左右
到此,關于“Python+BI怎么爬取車厘子數據”的學習就結束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續學習更多相關知識,請繼續關注億速云網站,小編會繼續努力為大家帶來更多實用的文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。