中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么用python分析電影票房

發布時間:2022-05-09 13:38:39 來源:億速云 閱讀:870 作者:zzz 欄目:大數據

這篇文章主要介紹“怎么用python分析電影票房”的相關知識,小編通過實際案例向大家展示操作過程,操作方法簡單快捷,實用性強,希望這篇“怎么用python分析電影票房”文章能幫助大家解決問題。

一、提出問題

本案例來源于kaggle上的TMDB 5000 Movie Dataset數據集,為了探討電影數據可視化,為電影的制作提供數據支持,主要研究以下幾個問題:

  • 電影類型如何隨著時間的推移發生變化的?

  • 電影類型與利潤的關系?

  • Universal和Paramount兩家影視公司的對比情況如何?

  • 改編電影和原創電影的對比情況如何?

  • 電影時長與電影票房及評分的關系?

  • 分析電影關鍵字

二、理解數據

1、采集數據

從kaggle上的TMDB 5000 Movie Dataset下載數據集:

https://www.kaggle.com/tmdb/tmdb-movie-metadata

2、導入數據

怎么用python分析電影票房

3、查看數據集信息

怎么用python分析電影票房

下面是moviedf數據集中部分字段的含義介紹:

  • id: 標識號

  • imdb id:IMDB標識號

  • popularity: 在Movie Database上的相對頁面查看次數

  • budget: 預算(美元)

  • revenue: 收入(美元)

  • original_title: 電影名稱

  • cast: 演員列表,按|分隔,最多5名演員

  • homepage: 電影首頁的URL

  • director: 導演列表,按|分隔,最多5名導演

  • tagline: 電影的標語

  • keywords: 與電影相關的關鍵字,按|分隔,最多5個關鍵字

  • overview: 劇情摘要

  • runtime: 電影時長

  • genres: 風格列表,按|分隔,最多5種風格

  • production_companies: 制作公司列表,按|分隔,最多5家公司

  • release_date: 首次上映日期

  • vote_count: 評分次數

  • vote_average: 平均評分·release year: 發行年份

三、數據清洗

1、先將credits數據集和moviedf數據集中的數據合并在一起,再查看合并后的數據集信息:

怎么用python分析電影票房

2、選取子集

由于數據集中包含的信息過多,其中部分數據并不是我們研究的重點,所以從中選取我們需要的數據:

怎么用python分析電影票房

由于后面的數據分析涉及到電影類型的利潤計算,先求出每部電影的利潤,并在數據集moviesdf中增加profit數據列:

怎么用python分析電影票房

3、缺失值處理

通過上面的數據集信息可以知道:整個數據集缺失的數據比較少 其中release_date(首次上映日期)缺失1個數據,runtime(電影時長)缺失2個數據,可以通過網上查詢補齊這個數據。

填補release_date(首次上映日期)數據:

怎么用python分析電影票房

找出runtime(電影時長)缺失的數據:

怎么用python分析電影票房

填充runtime缺失值:

怎么用python分析電影票房

4、數據格式轉換

genres列數據處理:

怎么用python分析電影票房

release_date列數據處理:

怎么用python分析電影票房

四、數據分析及可視化

問題一:電影類型如何隨著時間的推移發生變化的?

1、建立包含年份與電影類型數量的關系數據框:

怎么用python分析電影票房

2、數據可視化

繪制各種電影類型的數量柱狀圖:

怎么用python分析電影票房

怎么用python分析電影票房

繪制各種電影類型占比的餅狀圖:

怎么用python分析電影票房

怎么用python分析電影票房

分析結論:

  • 從上面的結果可以看出,在所有的電影類型中,Drama(戲劇)類型電影最多,占所有電影類型的18.9%,其次為Comedy(喜劇),占所有電影類型的14.2%。

  • 在所有電影類型中,電影數量排名前5的電影類型分別為: Drama(戲劇)、Comedy(喜劇)、Thriller(驚悚)、Action(動作)、Romance(冒險)。

3、電影類型隨時間變化的趨勢分析:

怎么用python分析電影票房

分析結論:

從圖中觀察到,隨著時間的推移,所有電影類型都呈現出增長趨勢,尤其是1992年以后各個類型的電影均增長迅速,其中Drama(戲劇)和Comedy(喜劇)增長最快,目前仍是最熱門的電影類型。

問題二:電影類型與利潤的關系?

先求出各種電影類型的平均利潤:

怎么用python分析電影票房

電影類型平均利潤數據可視化:

 怎么用python分析電影票房

分析結論:

從圖中觀察到,拍攝Animation、Adventure、Fantasy這三類電影盈利最好,而拍攝Foreign、TV、Movie這三類電影會存在虧本的風險。

問題三:Universal Pictures和Paramount Pictures兩家影視公司發行電影的對比情況如何?

Universal Pictures(環球影業)和Paramount Pictures(派拉蒙影業)是美國兩家電影巨頭公司。

1、查看 Universal Pictures和Paramount Pictures兩家影視公司電影發行的數量

先對production_companies列數據進行處理:

怎么用python分析電影票房

查詢production_companies數據列并統計Universal Pictures和Paramount Pictures的數據:

怎么用python分析電影票房

使用餅狀圖比較兩家公司發行的電影占比:

怎么用python分析電影票房

2、分析Universal Pictures和Paramount Pictures兩家影視公司電影發行的走勢

抽取相關數據列進行處理:

怎么用python分析電影票房

兩家影視公司電影發行的折線圖:

怎么用python分析電影票房

分析結論:

從圖中觀察到,隨著時間的推移,Universal Pictures和Paramount Pictures公司的電影發行量呈現出增長趨勢,尤其是在1995年后增長迅速,其中Universal Pictures公司比Paramount Pictures公司發行的電影數量更多。

問題四:改編電影和原創電影的對比情況如何?

對keywords列數據處理:

怎么用python分析電影票房

描繪柱狀圖,對改編電影與原創電影在預算、收入及利潤三方面進行比較:

怎么用python分析電影票房

分析結論:

從圖上可以看出,改編電影的預算略高于原創電影,但改編電影的票房收入和利潤遠遠高于原創電影, 這可能是改編電影擁有一定的影迷基礎。

問題五:電影時長與電影票房及評分的關系

電影時長與電影票房的關系:

怎么用python分析電影票房

電影時長與電影平均評分的關系:

怎么用python分析電影票房

分析結論:

從圖上可以看出,電影要想獲得較高的票房及良好的口碑,電影的時長應保持在90~150分鐘內。

問題六:分析電影關鍵字

先提取電影關鍵字:

怎么用python分析電影票房

通過詞云包WordCloud生成詞云圖:

怎么用python分析電影票房

關于“怎么用python分析電影票房”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識,可以關注億速云行業資訊頻道,小編每天都會為大家更新不同的知識點。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

淮北市| 铜川市| 柳林县| 张掖市| 阿拉善右旗| 金塔县| 临夏县| 昌都县| 黎川县| 昌图县| 历史| 内江市| 玉林市| 青州市| 临西县| 桃江县| 西丰县| 崇阳县| 博客| 峨眉山市| 轮台县| 绩溪县| 沂水县| 九龙坡区| 长子县| 南安市| 怀远县| 沈阳市| 长兴县| 繁峙县| 卓尼县| 平乐县| 安龙县| 东平县| 宁夏| 台前县| 荥阳市| 平湖市| 花莲县| 永兴县| 宜兰县|