您好,登錄后才能下訂單哦!
這篇文章主要介紹了Pandas1.0的主要功能有哪些,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。
注意:Pandas 1.0.0rc已于1月9日發布,先前的版本為0.25。
Pandas首個全新主要發行版本包含許多重要功能:更完善的數據框自動匯總、更全面的輸出格式、全新的數據類型以及文檔站點。
在全新的文檔站點上,可以找到完整的發行說明,但小芯認為,技術含量較低的概述也會有所幫助。
用戶可以使用 pip升級Pandas,以便使用其新版本。在撰寫本文時,Pandas1.0仍然是候選版本,這意味著要安裝Pandas1.0需要明確指定其版本。
pip install --upgradepandas==1.0.0rc0
當然,更新可能會破壞某些代碼,因為這是主要版本的發布,因此請務必小心! 此版本的Pandas不再支持Python 2。運行Pandas 1.0+至少需要Python 3.6+,因此請確保使用合適版本的pip 和python。
$ pip --version pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)$ python--version Python 3.7.5
用戶可以確認一切正常,并且Pandas使用的是正確版本。
>>> import pandas as pd >>> pd.__version__ 1.0.0rc0
使用DataFrame.info更好的自動匯總
筆者最喜歡的新功能是優化之后的DataFrame.info法。現在,它使用了更具可讀性的格式,從而使數據探索過程更加容易。
>>> df = pd.DataFrame({ ...: 'A': [1,2,3], ...: 'B': ["goodbye","cruel", "world"], ...: 'C': [False, True, False] ...:}) >>> df.info() <class 'pandas.core.frame.DataFrame'> RangeIndex: 3 entries, 0 to 2 Data columns (total 3 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 A 3 non-null int64 1 B 3 non-null object 2 C 3 non-null object dtypes: int64(1), object(2) memory usage: 200.0+ bytes
Markdown表的輸出格式
其次,筆者最喜歡的功能是使用新的 DataFrame.to_markdown 法將數據幀導出到Markdown表中。
>>> df.to_markdown() | | A | B | C | |---:|----:|:--------|:------| | 0 | 1 | goodbye | False | | 1 | 2 | cruel | True | | 2 | 3 | world | False |
這樣一來,通過github gists在Medium等地方顯示表格更加便捷。
booleans and strings的新數據類型
Pandas1.0還為booleans and strings引入了實驗數據類型。
由于這些更改是實驗性的,數據類型的API可能會稍有更改,因此應謹慎使用。但是Pandas建議在合理的地方使用這些數據類型,將來的版本將完善諸如regex匹配之類的特定于類型的操作性能。
默認情況下,Pandas不會自動將數據強制轉換為這些類型。但是,如果明確指示Pandas,仍然可以使用它們。
>>> B =pd.Series(["goodbye", "cruel", "world"],dtype="string") >>> C = pd.Series([False, True, False], dtype="bool") >>> df.B = B, df.C = C >>> df.info() <class 'pandas.core.frame.DataFrame'> RangeIndex: 3 entries, 0 to 2 Data columns (total 3 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 A 3 non-null int64 1 B 3 non-null string 2 C 3 non-null bool dtypes: int64(1), object(1), string(1) memory usage: 200.0+ bytes
注意Dtype列現在如何反應新類型的string和bool。
新字符串dtype最實用的優勢在于,可以從DataFrame中選擇string列。這樣可以更快地僅對數據集的文本成分進行分析。
df.select_dtypes("string")
以前,只能通過顯式使用其名稱來選擇string類型列。
感謝你能夠認真閱讀完這篇文章,希望小編分享的“Pandas1.0的主要功能有哪些”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業資訊頻道,更多相關知識等著你來學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。