您好,登錄后才能下訂單哦!
本篇文章給大家分享的是有關怎樣讓用python爬取龍嶺迷窟評論,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。
最近不知道大家發現沒有,新出了幾部國產好劇,其中小五比較喜歡的就是鬼吹燈系列的《龍嶺迷窟》。
自從開播以來,獲得好評無數,豆瓣評分開播8.4分,目前有所回落,維持在8.2分,無論是原著粉還是路人觀眾,都對這部新網劇贊譽有加。在《鬼吹燈》系列的眾多影視化作品中名列前茅。
《鬼吹燈》之所以作品這么多,是由于小說的版權非常分散。這也導致制作團隊不同,水平更是良莠不齊,正所謂是《一個“鬼吹燈”,八個胡八一;八部《鬼吹燈》,版權花落多少家?》(當然對比盜墓筆記系列的影視化作品來講,還是要略勝一籌的。)
今天不說一些,只聊一聊大家對《龍嶺迷窟》的評價,并和同系列其他網劇以及《盜墓筆記》網劇做個小對比。
對于一部國產網劇,如果想分析它的評分與評價,那么似乎只有豆瓣這一個網站可以選擇了。
而每一個學python的人,應該寫過豆瓣,拉勾,網易云“三劍客”的爬蟲吧?
那么爬蟲部分就不一一贅述了。
for comment in comments:
# 獲取用戶名
user = comment.xpath('.//h4/span[2]/a/text()')[0]
# 獲取評星
star = comment.xpath('.//h4/span[2]/span[2]/@class')[0][7:8]
# 獲取時間
date_time = comment.xpath('.//h4/span[2]/span[3]/@title')
# 獲取評論文字
comment = comment.xpath('.//p/span/text()')[0].strip()
目前無論采用哪種方法,豆瓣的爬蟲都只能爬到500條評論。
首先在評分分布上,有70.6%的人都給出了5星好評,給1星的最少僅為3.2%,百分百的好劇評分分布。
不過我們是數據可視化了500條短評,所以最終據結果與豆瓣評分對比肯定差異較大。
關于評論時間的走勢圖呢,發現分布非常不均勻。
為什么呢?仔細一看兩個極值點分別是4月2日和4月9日,正好相差一周。
如果看過這部劇的同學相信一下就知道原因了。
《龍嶺迷窟》網劇是每周三晚8點更新,那么當晚和第二天對該劇的評分以及新劇情的討論肯定是最高峰啊。
我們在爬取豆瓣的評分評論時,順便還爬到了評論用戶的個人主頁url。
那么我們也可以根據url對他的個人主頁進行訪問,順便獲取他的個人信息。
再利用pyecharts制作《龍嶺迷窟》豆瓣短評用戶的地域分布圖。
其中評論人群北京最多,其次是上海、廣東。
(這個最好跟豆瓣的用戶群體對比一下)
在凹凸數據做的統計中,《龍嶺迷窟》、《精絕古城》 是目前評分最高的兩部《鬼吹燈》系列影視化作品。
那么就看看大家分別對他們的評價如何吧。
兩個詞云圖中的詞語基本都是正向的。
不過《龍嶺迷窟》中主要圍繞潘粵明飾演的胡八一、高偉光飾演的鷓鴣哨以及王胖子,而張雨綺飾演的雪莉楊討論度卻不高。
《精絕古城》則正好相反,陳喬恩的關注度非常高。
看過很多分析豆瓣的文章,這次我們玩點新的。
看看哪些觀眾看過這兩部網劇,又是分別打多少分的?分別怎么評價的?
分別爬取兩部劇的評論各500條,利用 merge() 方法將兩個表橫向,并指定評論用戶url為內連接的連接鍵。
df3 = pd.merge(df1,df2,on='user_url',how = 'inner')
看看其中給龍嶺迷窟打分> 精絕古城的評分與評論:
df3[df3['star_x'] > df3['star_y']][['name_x','star_x','comment_x','star_y','comment_y']]```
給龍嶺迷窟打分> 精絕古城的評論似乎也沒有什么強有力的理由,唯一一個就是給精絕古城打1分的,是認為陳喬恩不適合這個角色。
其中給龍嶺迷窟打分< 精絕古城的評分與評論:
df3[df3['star_x'] < df3['star_y']][['name_x','star_x','comment_x','star_y','comment_y']]
吐槽胡八一太胖可還行
這兩部劇對比更像是中青年的胡胖搭檔的對比。
上一節做了詞云,此處就來個詞頻吧。
《黃皮子墳》相比《龍嶺迷窟》,阮經天的臺灣省口音還是提到的比較多的詞語。
看看哪些觀眾看過這兩部網劇,又是分別打多少分的?分別怎么評價的?
看看其中給龍嶺迷窟打分> 黃皮子墳的評分與評論:
其中打低分的理由很多,相對于演員選角,劇本改編的問題似乎更受質疑。
其中給龍嶺迷窟打分< 黃皮子墳的評分與評論:
無
《鬼吹燈》和《盜墓筆記》作為國內最出名的兩部盜墓題材小說,非常相似,都是鐵三角組合。
大家經常拿他們倆對比,影視化作品自然也不會少了相互對比。
其實我是想做一個用戶人群的畫像,但是豆瓣無法獲取更多的評論用戶個人信息。
所以我選擇了百度指數,看看分別搜索這兩部小說的人群有什么不同點?
非常明顯,《盜墓筆記》的粉絲群體中女性比例遠高于《鬼吹燈》。
個人認為主要是受到小說內容,以及后期影視化過程中演員選角的影響。
看《盜墓筆記》的年齡段相對于《鬼吹燈》來說,也較低一些。
那么改編成網劇后,大家又是如何評價的呢?
看看其中給龍嶺迷窟打分> 盜墓筆記的評分與評論:
真的是滿屏的1分啊,不多說自己看吧。
現在我回憶起來也只記得“上交國家”和隨處可見的“紅牛”了。
其中給龍嶺迷窟打分< 盜墓筆記的評分與評論:
無
很高興國產網劇能又出現一部好劇,同時演員又都在線。
潘粵明在《怒晴湘西》演過陳玉樓,在本劇又演胡八一,再次體驗一人飾演兩個角色。“李大嘴”姜超飾演的王凱旋,終于像王胖子了。身為一個廚子,拿個工兵鏟炒炒菜怎么了。
看的出來《龍嶺迷窟》劇組從主角到配角他們都在用心地在挑選、在打磨。
這樣的劇確實配得上觀眾給出的高分。
以上就是怎樣讓用python爬取龍嶺迷窟評論,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。