如何用一行Python進行數據收集探索

發布時間：2021-10-25 17:23:40 來源：億速云閱讀：132 作者：柒染欄目：編程語言

本篇文章給大家分享的是有關如何用一行Python進行數據收集探索，小編覺得挺實用的，因此分享給大家學習，希望大家閱讀完這篇文章后可以有所收獲，話不多說，跟著小編一起來看看吧。

簡易的Pandas之路

任何使用Python數據的人都會熟悉Pandas包。Pandas是大多數行和列格式數據的go-to包。如果你沒有Pandas，請確保在終端中使用pip install安裝：

pip install pandas

現在，讓我們看看Pandas包中的默認方法可以做些什么：

以下內容寫給不知道上面發生了什么的新手：

任何Pandas數據幀都有一個.descripe（）返回上面的輸出的方法。但是，此方法中沒有注意到分類變量。在上面的示例中，輸出中完全省略了“ method ”列。

讓我們看看能不能解決這個問題。

如果我告訴你僅用3行Python就可以產生以下統計信息，你會怎么想？但其實，如果不計算imports的話，總體上只用1行就夠。

（功能列表直接來自Pandas Profiling GitHub）

好吧，我們可以使用Pandas Profiling軟件包！要安裝Pandas Profiling軟件包，只需在終端中使用pip install即可：

pip install pandas_profiling

經驗豐富的數據分析人員可能會因為這些數據的松散甚至乍一看之下的“華而不實”而嗤之以鼻，但這對于快速獲得數據的第一手印象肯定是有用的：

我們首先看到的是概述，其中提供了關于數據和變量的一些非常高級的統計信息，以及變量之間的高相關性、高偏態性的警告等。

但這還不算什么。向下滾動我們會發現報告有多個部分，如果只是簡單地用圖片展示這個1行程序的輸出是不足以完全呈現這些內容的，所以我制作了一個gif：

我強烈建議大家自己去探索一下這個包的特性，畢竟，這里提到的只是一行代碼，在將來的數據分析中，這個包可能會對你非常有用。

import pandas as pd
import pandas_profiling
pd.read_csv('https://raw.githubusercontent.com/mwaskom/seaborn-data/master/planets.csv').profile_report()

以上就是如何用一行Python進行數據收集探索，小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。

向AI問一下細節

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站