中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

python中pandas_profiling怎么用

發布時間:2021-11-30 14:28:59 來源:億速云 閱讀:625 作者:小新 欄目:大數據

小編給大家分享一下python中pandas_profiling怎么用,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!

分析報告全貌

?

python中pandas_profiling怎么用

什么是探索性數據分析

熟悉pandas的童鞋估計都知道pandas的describe()和info()函數,用來查看數據的整體情況,比如平均值、標準差之類,就是所謂的探索性數據分析-EDA。

pandas_profiling簡介

如果你想更方便快捷地了解數據的全貌,泣血推薦一個python庫:pandas_profiling,這個庫只需要一行代碼就可以生成數據EDA報告。

pandas_profiling基于pandas的DataFrame數據類型,可以簡單快速地進行探索性數據分析。

對于數據集的每一列,pandas_profiling會提供以下統計信息:

1、概要:數據類型,唯一值,缺失值,內存大小
2、分位數統計:最小值、最大值、中位數、Q1、Q3、最大值,值域,四分位

3、描述性統計:均值、眾數、標準差、絕對中位差、變異系數、峰值、偏度系數

4、最頻繁出現的值,直方圖/柱狀圖

5、相關性分析可視化:突出強相關的變量,Spearman, Pearson矩陣相關性色階圖

并且這個報告可以導出為HTML,非常方便查看。

pandas_profiling安裝

安裝pandas_profiling可以使用pip、conda或者下載文件安裝,非常方便。

我這里使用pip方式,在命令行輸入:

pip install pandas-profiling

本文在Jupyter notebook中進行代碼實驗

pandas_profiling使用方法

1、加載數據集

我這里用經典的泰坦尼克數據集:

# 導入相關庫import seaborn as snsimport pandas as pdimport pandas_profiling as ppimport matplotlib.pyplot as plt# 加載泰坦尼克數據集data = sns.load_dataset('titanic')data.head()

輸出:

python中pandas_profiling怎么用

2、使用pandas_profiling生成數據探索報告

report = pp.ProfileReport(data)report

輸出報告:

python中pandas_profiling怎么用

python中pandas_profiling怎么用

python中pandas_profiling怎么用

python中pandas_profiling怎么用

python中pandas_profiling怎么用

python中pandas_profiling怎么用

python中pandas_profiling怎么用

python中pandas_profiling怎么用

python中pandas_profiling怎么用

python中pandas_profiling怎么用

3、導出為html文件

report.to_file('report.html')

看完了這篇文章,相信你對“python中pandas_profiling怎么用”有了一定的了解,如果想了解更多相關知識,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

峨山| 若尔盖县| 竹北市| 永吉县| 北票市| 北川| 大厂| 东兰县| 伊金霍洛旗| 钟山县| 无为县| 和林格尔县| 台湾省| 无锡市| 前郭尔| 鄂尔多斯市| 两当县| 定襄县| 定兴县| 松阳县| 桃源县| 河源市| 九寨沟县| 渝中区| 淮安市| 鹤岗市| 阿鲁科尔沁旗| 和平县| 威海市| 宿迁市| 曲阳县| 娄烦县| 绵竹市| 海门市| 凤山县| 南和县| 柘荣县| 女性| 连城县| 兴文县| 莆田市|