您好,登錄后才能下訂單哦!
Python爬取并分析全球最美Top100女神榜單的數據,相信很多沒有經驗的人對此束手無策,為此本文總結了問題出現的原因和解決方法,通過這篇文章希望你能解決這個問題。
最近一段時間,國外媒體TOP BEAUTY WORLD選取了全球最帥男性和最美女性前100名,肖戰成為了該排行榜歷屆以來首位登頂的亞洲人。這一消息立刻成為了流量的熱點。
小編特地去查了一下,想看一下榜單中的最美小姐姐的信息。可是現在還沒有最美小姐姐的文字榜單信息。但是小編卻查到了2019年年底發布的上一屆的全球最美女性前一百名的詳細榜單,包含了姓名、國籍和職業等信息。
首先,我們要獲取到想要的數據,包括小姐姐的照片,姓名以及國籍等信息。由于網頁屬于靜態網頁,因此可以直接分析網頁源代碼,獲取到我們需要的數據即可。程序如下圖所示:
獲取到數據后,我們來對數據進行一下清晰,并看一下從數據中能獲得什么信息。
1).大洲信息統計
可以看到,全球一百名美女來自了除南極洲之外的其他六個大洲,其中來自亞洲的國家是最多的,歐洲和北美洲緊隨其后。
2).國籍信息統計
對于美女國籍的統計和可視化處理,是一件非常麻煩的事情,這里需要針對數據進行耐心的判斷處理,雖然非常消耗時間,但是好在數量并不是很多,如下圖所示:
可以看到,這一百名美女中,來自美國的是最多的,當然,不可否認的是很多都是持有美國和其他國家的雙重國籍身份的。來自英國的是13名美女,當然也是有許多是持有雙重國籍的身份。
而第三名的中國和韓國則是完全不存在雙重國籍的問題。從全球的分布范圍來看,非洲和歐洲的人數直觀看上去非常的少,尤其是意大利、法國等一些歐洲國家,都沒有如選前100名的美女出現。
3).職業分析
對于榜單中美女們的職業,這里也是非常的集中,只有三種職業:模特、演員、歌手。毫無疑問,每一個職業都是需要自身的條件非常的完美。
上述程序中,通過向FaceScore函數傳遞圖片的路徑,在FaceScore函數中,通過get_file_content函數將圖片以二進制形式讀取;
并通過base64庫進行編碼后,作為params參數post給請求url鏈接。并解析url鏈接返回的信息,提取返回信息中的顏值打分數據;
運行上述的程序后,我們就會得到關于100名美女的AI顏值打分。這里 我們為大家展示一下,顏值打分前五名都有哪些明星。
看完上述內容,你們掌握Python爬取并分析全球最美Top100女神榜單的數據的方法了嗎?如果還想學到更多技能或想了解更多相關內容,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。