中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

關于pandas的離散化,面元劃分詳解

發布時間:2020-10-08 18:20:57 來源:腳本之家 閱讀:150 作者:路在亻壬走 欄目:開發技術

pd.cut

pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False)

x:要分箱的輸入數組,必須是一維的

bins:int或標量序列

若bins是一個int,它定義在x范圍內的等寬單元的數量。然而,在這種情況下,x的范圍在每一側延伸0.1%以包括x的最小值或最大值

若bins是一個序列,它定義了允許非均勻bin寬度的bin邊緣。在這種情況下不進行x的范圍的擴展

right:bool,可選:決定區間的開閉,如果right == True(默認),則區間[1,2,3,4]指示(1,2],(2,3],(3,4]

labels:array或boolean,默認值為無:用作生成的區間的標簽。必須與生成的區間的長度相同。如果為False,則只返回bin的整數指示符

retbins:bool,可選:是否返回bin。如果bin作為標量給出,則可能有用

precision:int:存儲和顯示容器標簽的精度,默認保留三位小數

include_lowest:bool:第一個間隔是否應該包含左邊

import numpy as np
import pandas as pd
# 使用pandas的cut函數劃分年齡組
ages = [20,22,25,27,21,23,37,31,61,45,32]
bins = [18,25,35,60,100]
cats = pd.cut(ages,bins)
print(cats) # 分類時,當數據不在區間中將變為nan
# 統計落在各個區間的值數量
print(pd.value_counts(cats))
# 使用codes為年齡數據進行標號
print(cats.codes)
# 設置自己想要的面元名稱
group_names = ['Youth','YoungAdult','MiddleAged','Senior']
print(pd.cut(ages, bins, labels=group_names))
# 設置區間數學符號為左閉右開
print(pd.cut(ages, bins, right=False))
# 向cut傳入面元的數量,則會根據數據的最小值和最大值計算等長面元
print(pd.cut(ages, 4, precision=2)) # precision=2表示設置的精度

pd.qcut

與cut類似,它可以根據樣本分位數對數據進行面元劃分

pandas.qcut(x, q, labels=None, retbins=False, precision=3) 

x:ndarray或Series

q:整數或分位數陣列分位數。十分位數為10,四分位數為4或者,分位數陣列,例如[0,.25,.5,.75,1.]四分位數

labels:array或boolean,默認值為無:用作生成的區間的標簽。必須與生成的區間的長度相同。如果為False,則只返回bin的整數指示符。

retbins:bool,可選:是否返回bin。如果bin作為標量給出,則可能有用。

precision:int:存儲和顯示容器標簽的精度

import numpy as np
import pandas as pd

# qcut可以根據樣本分位數對數據進行面元劃分
# data = np.random.randn(20) # 正態分布
data = [1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]
cats = pd.qcut(data, 4) # 按四分位數進行切割
print(cats)
print(pd.value_counts(cats))
print("-------------------------------------------------")
# 通過指定分位數(0到1之間的數值,包含端點)進行面元劃分
cats_2 = pd.qcut(data, [0, 0.5, 0.8, 0.9, 1])
print(cats_2)
print(pd.value_counts(cats_2))

以上這篇關于pandas的離散化,面元劃分詳解就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持億速云。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

阆中市| 华坪县| 山阳县| 万荣县| 舒城县| 蓝田县| 年辖:市辖区| 玉田县| 随州市| 南昌市| 贞丰县| 滁州市| 土默特左旗| 南江县| 酉阳| 青田县| 荔波县| 昭通市| 汉中市| 新乐市| 宁波市| 阳谷县| 惠来县| 灵川县| 乐昌市| 新野县| 沾化县| 濮阳县| 陈巴尔虎旗| 利辛县| 广南县| 广安市| 武宣县| 桐柏县| 高要市| 潼南县| 安远县| 贵德县| 泸溪县| 广平县| 石狮市|