中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

pandas的get_dummies()與factorize()怎么使用

發布時間:2022-02-24 17:39:44 來源:億速云 閱讀:149 作者:iii 欄目:開發技術

這篇文章主要介紹了pandas的get_dummies()與factorize()怎么使用的相關知識,內容詳細易懂,操作簡單快捷,具有一定借鑒價值,相信大家閱讀完這篇pandas的get_dummies()與factorize()怎么使用文章都會有所收獲,下面我們一起來看看吧。

1.get_dummies()

pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None,sparse=False, drop_first=False):Convert categorical variable into dummy/indicator variables

>>> import pandas as pd
>>> s = pd.Series(list('abca'))
>>> pd.get_dummies(s)
   a  b  c
0  1  0  0
1  0  1  0
2  0  0  1
3  1  0  0

2.pd.factorize()

pandas.factorize(values, sort=False, order=None, na_sentinel=-1,size_hint=None):Encode input values as an enumerated type or categorical variable

Series.factorize(sort=False, na_sentinel=-1):Encode the object as an enumerated type or categorical variable

Pandas有一個方法叫做factorize(),它可以創建一些數字,來表示類別變量,對每一個類別映射一個ID,這種映射最后只生成一個特征,不像dummy那樣生成多個特征。

Parameters:

sort : boolean, default False

Sort by values

na_sentinel: int, default -1

Value to mark “not found”

Returns:

labels : the indexer to the original array

uniques : the unique Index

labels:對應的編碼array

uniques:需要編碼的類型

補充:pandas.get_dummies 的使用及含義

get_dummies 是利用pandas實現one hot encode的方式

get_dummies參數如下:

pandas.get_dummies(data,prefix = None,prefix_sep ='_',dummy_na = False,columns = None,sparse = False,drop_first = False,dtype = None )

data : array-like,Series或DataFrame

prefix :string,字符串列表或字符串dict,默認為None,

用于追加DataFrame列名的字符串。在DataFrame上調用get_dummies時,傳遞一個長度等于列數的列表。或者,前綴 可以是將列名稱映射到前綴的字典。

prefix_sep : string,默認為'_'

如果附加前綴,分隔符/分隔符要使用。或者傳遞與前綴一樣的列表或字典。

dummy_na : bool,默認為False

如果忽略False NaN,則添加一列以指示NaN。

columns : 類似列表,默認為無

要編碼的DataFrame中的列名稱。如果列是None,那么所有與列 對象或類別 D型細胞將被轉換。

sparse : bool,默認為False

偽編碼列是否應由SparseArray(True)或常規NumPy數組(False)支持。

drop_first : bool,默認為False

是否通過刪除第一級別從k分類級別獲得k-1個假人。

版本0.18.0中的新功能。

dtype: D型,默認np.uint8

新列的數據類型。只允許一個dtype。

版本0.23.0中的新功能。

關于“pandas的get_dummies()與factorize()怎么使用”這篇文章的內容就介紹到這里,感謝各位的閱讀!相信大家對“pandas的get_dummies()與factorize()怎么使用”知識都有一定的了解,大家如果還想學習更多知識,歡迎關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

北碚区| 鄂托克旗| 惠东县| 曲沃县| 甘南县| 大庆市| 蕲春县| 上饶市| 乌拉特后旗| 绵竹市| 安图县| 广河县| 中山市| 台北县| 肥西县| 华宁县| 芷江| 惠安县| 镇雄县| 宣武区| 尉氏县| 巴中市| 什邡市| 千阳县| 金川县| 定日县| 湘潭县| 鹤壁市| 峡江县| 利津县| 天气| 蒙自县| 定陶县| 胶南市| 新乐市| 万山特区| 望城县| 南皮县| 始兴县| 永年县| 社旗县|