您好,登錄后才能下訂單哦!
這篇文章主要介紹Pandas中apply函數怎么用,文中介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們一定要看完!
使用apply拆分文本
Pandas 中 apply 函數,應用廣泛,今天要跟大家分享一個使用的技巧,使用 apply 將 dataframe 中內容為 list 的列拆分為多列。
拆分前的數據情況,如下圖紅色標注所示:
拆分后,如下圖所示:
這個案例中,Lemon 使用的數據來自 akshare ,在開始前,引入相關 package :
# -*- coding: utf-8 -*- """ @Author: Lemon @出品:Python數據之道 @Homepage: liyangbit.com """ import numpy as np import pandas as pd import akshare as ak
Lemon 使用的幾個 Python 庫的版本信息如下:
print('numpy版本:{}'.format(np.__version__)) print('pandas版本:{}'.format(pd.__version__)) print('akshare版本:{}'.format(ak.__version__)) # numpy版本:1.18.1 # pandas版本:1.0.3 # akshare版本:0.7.53
如果代碼運行出現問題,請先檢查下這幾個Python庫的版本是否與上面的一致
先從 akshare 獲取需要的數據,分為兩步,第一步是獲取基金代碼的列表,如下:
df = ak.fund_em_fund_name().head(20).tail(5) dfdf = df[['基金代碼','基金簡稱']] print(df)
第二步是獲取基金凈值數據和凈值日期,通過一個自定義函數來獲取,自定義函數如下:
# 自定義函數只有一個參數的情形 # 獲取基金單位凈值以及凈值日期 def get_mutual_fund(code): df = ak.fund_em_open_fund_info(fund=code, indicator="單位凈值走勢") dfdf = df[['凈值日期', '單位凈值','日增長率']] # df.columns = ['凈值日期', '單位凈值', 'equityReturn', 'unitMoney'] df['凈值日期'] = pd.to_datetime(df['凈值日期']) dfdf = df.sort_values('凈值日期',ascending=False) unit_equity = df.head(1)['單位凈值'].values[0] date_latest = df.head(1)['凈值日期'].values[0] return [unit_equity, date_latest]
對于這個自定義函數,在 pandas 使用 apply 來應用自定義函數,這是使用 apply 的一種常用的方法,如下:
# 獲取基金最新的單位凈值和凈值日期 df['tmp'] = df['基金代碼'].apply(get_mutual_fund) print(df)
獲取的數據截圖如下:
文本拆分
上圖中的 tmp 列,就是我們這次需要進行處理的對象。
處理方法可以有多種,這里 Lemon 使用 pandas 中的 apply 來處理,相對來說,也是比較便捷的方式。
在 apply 函數中,使用 pd.Series 就可以達到我們的目的。
# 將單位凈值和凈值日期單獨成列 df[['最新單位凈值','凈值日期']] = df['tmp'].apply(pd.Series) dfdf = df.drop('tmp',axis=1) print(df)
結果如下:
以上是“Pandas中apply函數怎么用”這篇文章的所有內容,感謝各位的閱讀!希望分享的內容對大家有幫助,更多相關知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。