您好,登錄后才能下訂單哦!
這篇文章給大家介紹怎么在Python中實現數據規范化,內容非常詳細,感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。
1、云計算,典型應用OpenStack。2、WEB前端開發,眾多大型網站均為Python開發。3.人工智能應用,基于大數據分析和深度學習而發展出來的人工智能本質上已經無法離開python。4、系統運維工程項目,自動化運維的標配就是python+Django/flask。5、金融理財分析,量化交易,金融分析。6、大數據分析。
數據規范化
為了消除指標之間的量綱和取值范圍差異的影響,需要進行標準化(歸一化)處理,將數據按照比例進行縮放,使之落入一個特定的區域,便于進行綜合分析。
數據規范化方法主要有:
- 最小-最大規范化
- 零-均值規范化
數據示例
代碼實現
#-*- coding: utf-8 -*- #數據規范化 import pandas as pd import numpy as np datafile = 'normalization_data.xls' #參數初始化 data = pd.read_excel(datafile, header = None) #讀取數據 (data - data.min())/(data.max() - data.min()) #最小-最大規范化 (data - data.mean())/data.std() #零-均值規范化
從命令行可以看到下面的輸出:
>>> (data-data.min())/(data.max()-data.min(
0 1 2 3
0 0.074380 0.937291 0.923520 1.000000
1 0.619835 0.000000 0.000000 0.850941
2 0.214876 0.119565 0.813322 0.000000
3 0.000000 1.000000 1.000000 0.563676
4 1.000000 0.942308 0.996711 0.804149
5 0.264463 0.838629 0.814967 0.909310
6 0.636364 0.846990 0.786184 0.929571>>> (data-data.mean())/data.std()
0 1 2 3
0 -0.905383 0.635863 0.464531 0.798149
1 0.604678 -1.587675 -2.193167 0.369390
2 -0.516428 -1.304030 0.147406 -2.078279
3 -1.111301 0.784628 0.684625 -0.456906
4 1.657146 0.647765 0.675159 0.234796
5 -0.379150 0.401807 0.152139 0.537286
6 0.650438 0.421642 0.069308 0.595564
上述代碼改為使用print
語句打印,如下:
#-*- coding: utf-8 -*- #數據規范化 import pandas as pd import numpy as np datafile = 'normalization_data.xls' #參數初始化 data = pd.read_excel(datafile, header = None) #讀取數據 print((data - data.min())/(data.max() - data.min())) #最小-最大規范化 print((data - data.mean())/data.std()) #零-均值規范化
可輸出如下打印結果:
0 1 2 3
0 0.074380 0.937291 0.923520 1.000000
1 0.619835 0.000000 0.000000 0.850941
2 0.214876 0.119565 0.813322 0.000000
3 0.000000 1.000000 1.000000 0.563676
4 1.000000 0.942308 0.996711 0.804149
5 0.264463 0.838629 0.814967 0.909310
6 0.636364 0.846990 0.786184 0.929571
0 1 2 3
0 -0.905383 0.635863 0.464531 0.798149
1 0.604678 -1.587675 -2.193167 0.369390
2 -0.516428 -1.304030 0.147406 -2.078279
3 -1.111301 0.784628 0.684625 -0.456906
4 1.657146 0.647765 0.675159 0.234796
5 -0.379150 0.401807 0.152139 0.537286
6 0.650438 0.421642 0.069308 0.595564
關于怎么在Python中實現數據規范化就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。