中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python怎么從不同表格中提取數據

發布時間:2021-07-05 17:30:12 來源:億速云 閱讀:773 作者:Leah 欄目:編程語言

Python怎么從不同表格中提取數據,相信很多沒有經驗的人對此束手無策,為此本文總結了問題出現的原因和解決方法,通過這篇文章希望你能解決這個問題。

獲取谷歌表格數據

訪問谷歌表格是這三種方法中最復雜的,因為你需要在使用谷歌表格API前設置一些證書。理論上,你可以獲取一個公開可用的谷歌表(即提取源HTML代碼)但必須使用Beautiful  Soup之類的工具進行大量數據操作,才能將HTML轉儲轉換為有用的內容。我確實嘗試過,但是結果很糟糕,不值得一試。所以,API就是如此。此外,還將使用gspread無縫轉換數據分析DataFrame。

獲取OAuth3證書

前往谷歌開發人員控制臺,創建一個新項目(或選擇現有的項目)。點擊“創建項目”。如果公司使用谷歌郵件,可將其更改為私人帳戶,以避免潛在的權限沖突。

Python怎么從不同表格中提取數據

為項目命名(名稱無關緊要,此處將其命名為媒體數據提取)。

Python怎么從不同表格中提取數據

點擊APIs & Services ,前往library。

Python怎么從不同表格中提取數據

啟用谷歌Sheets API。單擊結果,并在如下頁面上單擊啟用 API。

Python怎么從不同表格中提取數據

創建一個服務帳戶和密鑰文件。服務帳戶是用于程序訪問的專用帳戶,訪問權限有限。服務帳戶可以而且應該通過有盡可能多的特定權限項目進行設置,當前的任務也需要如此。

Python怎么從不同表格中提取數據

創建JSON(另一種文件格式)密鑰文件。在角色上,選擇“Project -> Viewer”。

Python怎么從不同表格中提取數據

如果還沒有在前面的步驟中設置角色請立即設置。

Python怎么從不同表格中提取數據

注意:設置為“Viewer”會存在一些限制。如果希望以編程方式創建谷歌表格,則必須選擇不同的設置。

然后,私有JSON密鑰文件就可以下載或自動下載了。建議將該文件重命名為'Medium_Data_Extraction_Key,并將文件移動到JupyterNotebook文件夾中,以便與下面的示例無縫銜接。JSON文件包含最近創建的服務帳戶證書。

非常好,就要成功了。

下載數據

首先,必須下載并安裝其他軟件包,在筆記本中運行以下命令。

!pip install gspread

!pip install oauth3client

其次,如果還沒有移動密鑰文件的話,必須確保將之前創建的JSON密鑰文件移動到目前運行的木星筆記本(Jupyternotebook)文件夾中。或者,可以指定一個不同的GOOGLE_KEY_FILE路徑。

from oauth3client.service_account import ServiceAccountCredentials import gspread import pandas as pd scope = [  'https://www.googleapis.com/auth/spreadsheets', ] GOOGLE_KEY_FILE='Medium_Data_Extraction_Key.json' credentials = ServiceAccountCredentials.from_json_keyfile_name(GOOGLE_KEY_FILE, scope) gc = gspread.authorize(credentials) wokbook_key ='10HX66PbcGDvx6QKM8DC9_zCGp1TD_CZhovGUbtu_M6Y' workbook = gc.open_by_key(wokbook_key) sheet = workbook.get_worksheet(0) values = sheet.get_all_values() sales_data = pd.DataFrame(values[1:],columns=values[0]) WORKBOOK_KEY是為本章內容準備的谷歌表格的工作簿id。 WORKBOOK_KEY = '10HX66PbcGDvx6QKM8DC9_zCGp1TD_CZhovGUbtu_M6Y'

這份工作簿是公開的,如果想下載不同的數據,需要更改WORKBOOK_KEY。URL有問題的話,id通常可以在谷歌表格的最后兩個反斜杠之間找到。

獲取CSV數據

可以從repo以傳統方式下載CSV數據,也可以使用以下代碼片段進行下載。同樣地,可能需要在筆記本上安裝并運行缺失的請求包:

!pip install requests import requests url ='https://raw.githubusercontent.com/FBosler/Medium-Data-Extraction/master/sales_team.csv' res = requests.get(url, allow_redirects=True) withopen('sales_team.csv','wb') asfile:  file.write(res.content) sales_team = pd.read_csv('sales_team.csv')

CSV數據的美妙之處在于Python /panda可以立即進行處理。Excel則需要額外的庫。

獲取Excel數據

在開始之前,很可能還要安裝openpyxl和xlrd,這能讓Pandas也可以打開Excel表。

!pip install openpyxl

!pip install xlrd

完成這些步驟之后,可以相同的方式獲得Excel數據,并將其加載到另一個DataFrame中。

url ='https://github.com/FBosler/Medium-Data-Extraction/blob/master/invoices.xlsx?raw=true' res = requests.get(url, allow_redirects=True) withopen('invoices.xlsx','wb') asfile:  file.write(res.content) invoices = pd.read_excel('invoices.xlsx')

看完上述內容,你們掌握Python怎么從不同表格中提取數據的方法了嗎?如果還想學到更多技能或想了解更多相關內容,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

云南省| 昌江| 饶平县| 红原县| 福鼎市| 清远市| 南木林县| 安义县| 武山县| 莱西市| 松桃| 扎鲁特旗| 滨州市| 新田县| 义乌市| 庆云县| 诸暨市| 胶南市| 舒兰市| 宜宾县| 从江县| 遂宁市| 鄢陵县| 梓潼县| 内乡县| 吕梁市| 洛南县| 龙山县| 大丰市| 呈贡县| 灵璧县| 喜德县| 平湖市| 千阳县| 肇源县| 昭平县| 临城县| 宝山区| 山丹县| 青龙| 黄浦区|