中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python數據可視化基礎舉例分析

發布時間:2021-11-25 15:04:53 來源:億速云 閱讀:124 作者:iii 欄目:大數據

本篇內容主要講解“Python數據可視化基礎舉例分析”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“Python數據可視化基礎舉例分析”吧!

首先,要知道我們用哪些庫來畫圖?

matplotlib

python中最基本的作圖庫就是matplotlib,是一個最基礎的Python可視化庫,一般都是從matplotlib上手Python數據可視化,然后開始做縱向與橫向拓展。

Seaborn

是一個基于matplotlib的高級可視化效果庫,針對的點主要是數據挖掘和機器學習中的變量特征選取,seaborn可以用短小的代碼去繪制描述更多維度數據的可視化效果圖。

其他庫還包括

  • Bokeh(是一個用于做瀏覽器端交互可視化的庫,實現分析師與數據的交互)

  • Mapbox(處理地理數據引擎更強的可視化工具庫)等等

本篇文章主要使用matplotlib進行案例分析

確定問題,選擇圖形

業務可能很復雜,但是經過拆分,我們要找到我們想通過圖形表達什么具體問題。

在python中,我們可以總結為以下四種基本視覺元素來展現圖形:

  • 點:scatter plot 二維數據,適用于簡單二維關系

  • 線:line plot 二維數據,適用于時間序列

  • 柱狀:bar plot 二維數據,適用于類別統計

  • 顏色:heatmap 適用于展示第三維度

數據間存在分布,構成,比較,聯系以及變化趨勢等關系。對應不一樣的關系,選擇相應的圖形進行展示。

轉換數據,應用函數

數據分析和建模方面的大量編程工作都是用在數據準備的基礎上的:加載、清理、轉換以及重塑。我們可視化步驟也需要對數據進行整理,轉換成我們需要的格式再套用可視化方法完成作圖。

下面是一些常用的數據轉換方法:

  • 合并:merge,concat,combine_frist(類似于數據庫中的全外連接)

  • 重塑:reshape;軸向旋轉:pivot(類似excel數據透視表)

  • 去重:drop_duplicates

  • 映射:map

  • 填充替換:fillna,replace

  • 重命名軸索引:rename

  • 將分類變量轉換‘啞變量矩陣’的get_dummies函數以及在df中對某列數據取限定值等等

函數則根據第一步中選擇好的圖形,去找python中對應的函數。

參數設置,一目了然

原始圖形畫完后,我們可以根據需求修改顏色(color),線型(linestyle),標記(maker)或者其他圖表裝飾項標題(Title),軸標簽(xlabel,ylabel),軸刻度(set_xticks),還有圖例(legend)等,讓圖形更加直觀。

第三步是在第二步的基礎上,為了使圖形更加清晰明了,做的修飾工作。具體參數都可以在制圖函數中找到。

下面,我總結了實現可視化會用到的一些基礎知識

可視化作圖基礎

Matplotlib

#導入包
import numpy as np 
import pandas as pd
import matplotlib.pyplot as plt

Figure和Subplot

matplotlib的圖形都位于Figure(畫布)中,Subplot創建圖像空間。不能通過figure繪圖,必須用add_subplot創建一個或多個subplot。

figsize可以指定圖像尺寸。

#創建畫布
fig = plt.figure()
<Figure size 432x288 with 0 Axes>
#創建subplot,221表示這是2行2列表格中的第1個圖像。
ax1 = fig.add_subplot(221)
#但現在更習慣使用以下方法創建畫布和圖像,2,2表示這是一個2*2的畫布,可以放置4個圖像
fig , axes = plt.subplots(2,2,sharex=True,sharey=True)
#plt.subplot的sharex和sharey參數可以指定所有的subplot使用相同的x,y軸刻度。

Python數據可視化基礎舉例分析

利用Figure的subplots_adjust方法可以調整間距。

subplots_adjust(left=None,bottom=None,right=None,top=None,wspace=None,hspace=None)

#創建畫布
fig = plt.figure()
<Figure size 432x288 with 0 Axes>
#創建subplot,221表示這是2行2列表格中的第1個圖像。
ax1 = fig.add_subplot(221)
#但現在更習慣使用以下方法創建畫布和圖像,2,2表示這是一個2*2的畫布,可以放置4個圖像
fig , axes = plt.subplots(2,2,sharex=True,sharey=True)
#plt.subplot的sharex和sharey參數可以指定所有的subplot使用相同的x,y軸刻度。

Python數據可視化基礎講解

顏色color,標記marker,和線型linestyle

matplotlib的plot函數接受一組X和Y坐標,還可以接受一個表示顏色和線型的字符串縮寫:'g--',表示顏色是綠色green,線型是'--'虛線。也可以使用參數明確的指定。

線型圖還可以加上一些標記(marker),來突出顯示數據點的位置。標記也可以放在格式字符串中,但標記類型和線型必須放在顏色后面。

plt.plot(np.random.randn(30),color='g',linestyle='--',marker='o')
[<matplotlib.lines.Line2D at 0x8c919b0>]

Python數據可視化基礎舉例分析

刻度,標簽和圖例

plt的xlim、xticks和xtickslabels方法分別控制圖表的范圍和,刻度位置和刻度標簽。調用方法時不帶參數,則返回當前的參數值;調用時帶參數,則設置參數值。

plt.plot(np.random.randn(30),color='g',linestyle='--',marker='o')
plt.xlim()   #不帶參數調用,顯示當前參數;
#可將xlim替換為另外兩個方法試試
(-1.4500000000000002, 30.45)
plt.plot(np.random.randn(30),color='g',linestyle='--',marker='o')
plt.xlim([0,15])    #橫軸刻度變成0-15
(0, 15)

Python數據可視化基礎舉例分析

設置標題,軸標簽,刻度以及刻度標簽

fig = plt.figure();ax = fig.add_subplot(1,1,1)
ax.plot(np.random.randn(1000).cumsum())
ticks = ax.set_xticks([0,250,500,750,1000])  #設置刻度值
labels = ax.set_xticklabels(['one','two','three','four','five'])  #設置刻度標簽
ax.set_title('My first Plot')  #設置標題
ax.set_xlabel('Stage')  #設置軸標簽
Text(0.5,0,'Stage')

添加圖例

圖例legend是另一種用于標識圖標元素的重要工具。可以在添加subplot的時候傳入label參數。

fig = plt.figure(figsize=(12,5));ax = fig.add_subplot(111)
ax.plot(np.random.randn(1000).cumsum(),'k',label='one')  #傳入label參數,定義label名稱
ax.plot(np.random.randn(1000).cumsum(),'k--',label='two')
ax.plot(np.random.randn(1000).cumsum(),'k.',label='three')
#圖形創建完后,只需要調用legend參數將label調出來即可。
ax.legend(loc='best')  #要求不是很嚴格的話,建議使用loc=‘best’參數來讓它自己選擇最佳位置
<matplotlib.legend.Legend at 0xa8f5a20>

Python數據可視化基礎舉例分析

注解

除標準的圖表對象之外,我們還可以自定義添加一些文字注解或者箭頭。

注解可以通過text,arrow和annotate等函數進行添加。text函數可以將文本繪制在指定的x,y坐標位置,還可以進行自定義格式

plt.plot(np.random.randn(1000).cumsum())
plt.text(600,10,'test ',family='monospace',fontsize=10) 
#中文注釋在默認環境下并不能正常顯示,需要修改配置文件,使其支持中文字體。具體步驟請自行搜索。

保存圖表到文件

利用plt.savefig可以將當前圖表保存到文件。例如,要將圖表保存為png文件,可以執行

plt.savefig('figpath.png')

文件類型是根據拓展名而定的。其他參數還有:

  • fname含有文件路徑的字符串,拓展名指定文件類型

  • dpi分辨率,默認100facecolor,edgcolor 圖像的背景色,默認‘w’白色

  • format顯示設置文件格式('png','pdf','svg','ps','jpg'等)

  • bbox_inches: 圖表需要保留的部分。如果設置為“tight”,則將嘗試剪除圖像周圍的空白部分

plt.savefig('./plot.jpg')   #保存圖像為plot名稱的jpg格式圖像
<Figure size 432x288 with 0 Axes>

到此,相信大家對“Python數據可視化基礎舉例分析”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

彭山县| 克什克腾旗| 内黄县| 杭锦旗| 黔江区| 蒙自县| 宜州市| 普安县| 沅陵县| 扬中市| 龙江县| 彝良县| 文登市| 桓仁| 定南县| 新乐市| 岑溪市| 军事| 龙泉市| 陆河县| 蒲城县| 西盟| 方山县| 龙海市| 澄迈县| 武山县| 谷城县| 星子县| 沛县| 杭锦旗| 区。| 佛山市| 辽阳市| 沙田区| 双流县| 莒南县| 夏河县| 镇原县| 南京市| 波密县| 故城县|