您好,登錄后才能下訂單哦!
本篇文章為大家展示了Python中怎么重寫SQL查詢,內容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。
如果電腦中沒有pandas包,則需要先安裝一下:
Conda install pandas
在這個階段,我們將使用著名的Kaggle泰坦尼克數據集:https://www.kaggle.com/c/titanic/data?select=test.csv。
安裝軟件包并下載數據后,需要將其導入Python環境中:
import pandas as pd titanic_df = pd.read_csv("titanic_test_data.csv")
我們將使用pandas數據框架來存儲數據,還將用到各種pandas函數來操作數據框架。
SELECT, DISTINCT, COUNT, LIMIT
讓我們從經常使用的簡單SQL查詢開始。
titanic_df [“ age”]。unique()將在此處返回唯一值的數組,因此需要使用len()來獲取唯一值的計數。
SELECT,WHERE,OR,AND,IN(有條件選擇)
現在你知道了如何以簡單的方式探索數據框架,接著來嘗試一些條件吧(在SQL中是WHERE子句)。
如果只想從數據框架中選擇特定的列,則可以使用另一對方括號進行選擇。注意,如果要選擇多列,則需要在方括號內放置數組[“ name”,“ age”]。
isin()與SQL中的IN完全相同。要使用NOT IN,需要在Python中使用negation(?)來獲得相同的結果。
GROUP BY,ORDER BY,COUNT
GROUP BY和ORDER BY也是用來探索數據的流行SQL,讓我們在Python中嘗試一下。
如果只想對COUNT進行排序,可以將布爾值傳遞給sort_values函數;如果想對多列進行排序,則必須將布爾數組傳遞給sort_values函數。sum()函數將提供數據框架中的所有聚合數值總和列,如果只需要特定列,則需要使用方括號指定列名。
MIN,MAX,MEAN,MEDIAN
最后,來嘗試一些常見的統計功能,這些功能對于數據探索非常重要。
上述內容就是Python中怎么重寫SQL查詢,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。