如何進行Python Numpy的入門

發布時間：2021-10-26 10:51:40 來源：億速云閱讀：156 作者：柒染欄目：編程語言

如何進行Python Numpy的入門，相信很多沒有經驗的人對此束手無策，為此本文總結了問題出現的原因和解決方法，通過這篇文章希望你能解決這個問題。

Numpy是python語言中最基礎和最強大的科學計算和數據處理的工具包，如數據分析工具pandas也是基于numpy構建的，機器學習包scikit-learn也大量使用了numpy方法。本文介紹了Numpy的n維數組在數據處理和分析的所有核心應用。

1.如何構建numpy數組

構建numpy數組的方法很多，比較常用的方法是用np.array函數對列表進行轉化。

# 通過列表創建一維數組
import numpy as np
list1 = [0,1,2,3,4]
arr1d = np.array(list1)
#打印數組和類型
print(type(arr1d))
arr1d
<type 'numpy.ndarray'>
[0 1 2 3 4]

數組和列表最關鍵的區別是：數組是基于向量化操作的，列表不是，我們在實際項目中處理的數據一般是矩陣結構，對該數據以行向量或列向量的形式進行計算，向量計算是基于數組實現的，因此數組比列表的應用更廣。

函數可以應用到數組的每一項，列表不行。

比如，不可以對列表的每一項數據都加2，這是錯誤的。

list1 + 2 # 錯誤

可以對數組的某一項數據都加2

# Add 2 to each element of arr1d
arr1d + 2
#> array([2, 3, 4, 5, 6])

另一個區別是已經定義的numpy數組不可以增加數組大小，只能通過定義另一個數組來實現，但是列表可以增加大小。

然而，Numpy有更多的優勢，讓我們一起來發現。

numpy可以通過列表中的列表來構建二維數組。

# Create a 2d array from a list of lists
list2 = [[0,1,2], [3,4,5], [6,7,8]]
arr2d = np.array(list2)
arr2d
#> array([[0, 1, 2],
#> [3, 4, 5],
#> [6, 7, 8]])

你也可以通過dtype參數指定數組的類型，一些最常用的numpy類型是：'float'，'int'，'bool'，'str'和'object'。

# Create a float 2d array
arr2d_f = np.array(list2, dtype='float')
arr2d_f
#> array([[ 0., 1., 2.],
#> [ 3., 4., 5.],
#> [ 6., 7., 8.]])

輸出結果的小數點表示float類型，你也可以通過 astype方法轉換成不同的類型。

# 轉換成‘int’類型
arr2d_f.astype('int')
#> array([[0, 1, 2],
#> [3, 4, 5],
#> [6, 7, 8]])
# 先轉換‘int’類型，再轉換‘str’類型
arr2d_f.astype('int').astype('str')
#> array([['0', '1', '2'],
#> ['3', '4', '5'],
#> ['6', '7', '8']],
#> dtype='U21')

另一個區別是數組要求所有項是同一個類型，list沒有這個限制。如果你想要一個數組包含不同類型，設置‘dtype’為'object'。

# 構建布爾類型數組
arr2d_b = np.array([1, 0, 10], dtype='bool')
arr2d_b
#> array([ True, False, True], dtype=bool)
# 構建包含數值和字符串的數組
arr1d_obj = np.array([1, 'a'], dtype='object')
arr1d_obj
#> array([1, 'a'], dtype=object)

最終使用 tolist()函數使數組轉化為列表。

# Convert an array back to a list
arr1d_obj.tolist()
#> [1, 'a']

總結數組和列表主要的區別：

數組支持向量化操作，列表不支持；
數組不能改變長度，列表可以；
數組的每一項都是同一類型，list可以有多種類型；
同樣長度的數組所占的空間小于列表；

2.如何觀察數組屬性的大小和形狀（shape）

一維數組由列表構建，二維數組arr2d由列表的列表構建，二維數組有行和列，比如矩陣，三維數組由嵌入了兩個列表的列表構建。

假設給定一個數組，我們怎么去了解該數組的屬性。

數組的屬性包括：

數組的維度（ndim）
數組的形狀（shape）
數組的類型（dtype）
數組的大小（size）

數組元素的表示（通過索引）

# 定義3行4列的二維數組
list2 = [[1, 2, 3, 4],[3, 4, 5, 6], [5, 6, 7, 8]]
arr2 = np.array(list2, dtype='float')
arr2
#> array([[ 1., 2., 3., 4.],
#> [ 3., 4., 5., 6.],
#> [ 5., 6., 7., 8.]])
# 形狀（shape）
print('Shape: ', arr2.shape)
# 數組類型（dtype）
print('Datatype: ', arr2.dtype)
# 數組大小（size）
print('Size: ', arr2.size)
# 數組維度（ndim）
print('Num Dimensions: ', arr2.ndim)
# 取數組第3行3列元素
print('items of 3 line 3 column: ', c[2,2])
#> Shape: (3, 4)
#> Datatype: float64
#> Size: 12
#> Num Dimensions: 2
#> items of 3 line 3 column: 7

3. 如何從數組提取特定的項

數組的索引是從0開始計數的，與list類似。numpy數組通過方括號的參數以選擇特定的元素。

# 選擇矩陣的前兩行兩列
arr2[:2, :2]
list2[:2, :2] # 錯誤
#> array([[ 1., 2.],
#> [ 3., 4.]])

numpy數組支持布爾類型的索引，布爾型索引數組與過濾前（array-to-be-filtered）的數組大小相等，布爾型數組只包含Ture和False變量，Ture變量對應的數組索引位置保留了過濾前的值。

arr2
#> array([[ 1., 2., 3., 4.],
#> [ 3., 4., 5., 6.],
#> [ 5., 6., 7., 8.]])
# 對數組每一個元素是否滿足某一條件，然后獲得布爾類型的輸出
b = arr2 > 4
b
#> array([[False, False, False, False],
#> [False, False, True, True],
#> [ True, True, True, True]], dtype=bool)
# 取布爾型數組保留的原始數組的值
arr2[b]
#> array([ 5., 6., 5., 6., 7., 8.])

3.1 如何反轉數組

# 反轉數組的行
arr2[::-1, ]
#> array([[ 5., 6., 7., 8.],
#> [ 3., 4., 5., 6.],
#> [ 1., 2., 3., 4.]])
# Reverse the row and column positions
# 反轉數組的行和列
arr2[::-1, ::-1]
#> array([[ 8., 7., 6., 5.],
#> [ 6., 5., 4., 3.],
#> [ 4., 3., 2., 1.]])

3.2 如何處理數組的缺失值（missing）和無窮大（infinite）值

缺失值可以用np.nan對象表示，np.inf表示無窮大值，下面用二維數組舉例：

# 插入nan變量和inf變量
arr2[1,1] = np.nan # not a number
arr2[1,2] = np.inf # infinite
arr2
#> array([[ 1., 2., 3., 4.],
#> [ 3., nan, inf, 6.],
#> [ 5., 6., 7., 8.]])
# 用-1代替nan值和inf值
missing_bool = np.isnan(arr2) | np.isinf(arr2)
arr2[missing_bool] = -1 
arr2
#> array([[ 1., 2., 3., 4.],
#> [ 3., -1., -1., 6.],
#> [ 5., 6., 7., 8.]])

3.3 如何計算n維數組的平均值，最小值和最大值

# 平均值，最大值，最小值
print("Mean value is: ", arr2.mean())
print("Max value is: ", arr2.max())
print("Min value is: ", arr2.min())
#> Mean value is: 3.58333333333
#> Max value is: 8.0
#> Min value is: -1.0

如果要求數組的行或列的最小值，使用np.amin函數

# Row wise and column wise min
# 求數組行和列的最小值
# axis=0表示列，1表示行
print("Column wise minimum: ", np.amin(arr2, axis=0))
print("Row wise minimum: ", np.amin(arr2, axis=1))
#> Column wise minimum: [ 1. -1. -1. 4.]
#> Row wise minimum: [ 1. -1. 5.]

對數組的每個元素進行累加，得到一維數組，一維數組的大小與二維數組相同。

# 累加
np.cumsum(arr2)
#> array([ 1., 3., 6., 10., 13., 12., 11., 17., 22., 28., 35., 43.])

4.如何從現有的數組定義新數組

如果使用賦值運算符從父數組定義新數組，新數組與父數組共占同一個內存空間，如果改變新數組的值，那么父數組也相應的改變。

為了讓新數組與父數組相互獨立，你需要使用copy（）函數。所有父數組都使用copy（）方法構建新數組。

# Assign portion of arr2 to arr2a. Doesn't really create a new array.
# 分配arr2數組給新數組arr2a，下面方法并沒有定新數組
arr2a = arr2[:2,:2] 
arr2a[:1, :1] = 100 # arr2相應位置也改變了
arr2
#> array([[ 100., 2., 3., 4.],
#> [ 3., -1., -1., 6.],
#> [ 5., 6., 7., 8.]])
# 賦值arr2數組的一部分給新數組arr2b
arr2b = arr2[:2, :2].copy()
arr2b[:1, :1] = 101 # arr2沒有改變
arr2
#> array([[ 100., 2., 3., 4.],
#> [ 3., -1., -1., 6.],
#> [ 5., 6., 7., 8.]])

5.多維數組的重構（reshaping）和扁平（flattening）

重構（reshaping）是改變了數組項的排列，即改變了數組的形狀，未改變數組的維數。

扁平（flattening）是對多維數組轉化為一維數組。

# 3x4數組重構為4x3數組
arr2.reshape(4, 3)
#> array([[ 100., 2., 3.],
#> [ 4., 3., -1.],
#> [ -1., 6., 5.],
#> [ 6., 7., 8.]])

5.1 flatten()和ravel()的區別

數組的扁平化有兩種常用的方法，flatten()和ravel() 。flatten處理后的數組是父數組的引用，因此新數組的任何變化也會改變父數組，因其未用復制的方式構建數組，內存使用效率高，ravel通過復制的方式構建新數組。

# flatten方法
arr2.flatten()
#> array([ 100., 2., 3., 4., 3., -1., -1., 6., 5., 6., 7., 8.])
# flatten方法
b1 = arr2.flatten() 
b1[0] = 100 # 改變b1的值并未影響arr2
arr2
#> array([[ 100., 2., 3., 4.],
#> [ 3., -1., -1., 6.],
#> [ 5., 6., 7., 8.]])
# ravel方法
b2 = arr2.ravel() 
b2[0] = 101 # 改變b2值，相應的改變了arr2值
arr2
#> array([[ 101., 2., 3., 4.],
#> [ 3., -1., -1., 6.],
#> [ 5., 6., 7., 8.]])

6.如何通過numpy生成序列數（sequences），重復數（repetitions）和隨機數（random）

np.arrange函數手動生成指定數目的序列數，與ndarray作用一樣。

# 默認下限為0
print(np.arange(5)) 
# 0 to 9，默認步數為1
print(np.arange(0, 10)) 
# 遞增步數2
print(np.arange(0, 10, 2)) 
# 降序
print(np.arange(10, 0, -1))
#> [0 1 2 3 4]
#> [0 1 2 3 4 5 6 7 8 9]
#> [0 2 4 6 8]
#> [10 9 8 7 6 5 4 3 2 1]

上例是通過np.arrange設置初始位置和結束位置來生成序列數，如果我們設置數組的元素個數，那么可以自動計算數組的遞增值。

如構建1到50的數組，數組有10個元素，使用np.linspace總動計算數組的遞增值。

# 起始位置和結束位置分別為1和50
np.linspace(start=1, stop=50, num=10, dtype=int)
#> array([ 1, 6, 11, 17, 22, 28, 33, 39, 44, 50])

我們注意到上面例子的遞增值并不相等，有5和6兩個值，原因是計算遞增值采用了四舍五入的算法（rounding）。與np.linspace類似，np.logspace以對數尺度的方式增長。

# 設置數組的精度為小數點后兩位
np.set_printoptions(precision=2) 
# 起點為 10^1 and 終點為 10^50，數組元素個數10，以10為底數
np.logspace(start=1, stop=50, num=10, base=10) 
#> array([ 1.00e+01, 2.78e+06, 7.74e+11, 2.15e+17, 5.99e+22,
#> 1.67e+28, 4.64e+33, 1.29e+39, 3.59e+44, 1.00e+50])

初始化數組的元素全為1或全為0。

np.zeros([2,2])
#> array([[ 0., 0.],
#> [ 0., 0.]])
np.ones([2,2])
#> array([[ 1., 1.],
#> [ 1., 1.]])

6.1如何構建重復的序列數

np.tile重復整個的數組或列表n次，np.repeat重復數組每一項n次。
a = [1,2,3] 
# 重復數組a兩次
print('Tile: ', np.tile(a, 2))
# 重復數組a每項兩次
print('Repeat: ', np.repeat(a, 2))
#> Tile: [1 2 3 1 2 3]
#> Repeat: [1 1 2 2 3 3]

6.2 如何生存隨機數

random模塊包含的函數可以生成任一數組形狀的隨機數和統計分布。

# 生成2行2列的[0,1)的隨機數
print(np.random.rand(2,2))
# 生成均值為0方差為1的2行2列的正態分布值
print(np.random.randn(2,2))
# 生成[0,10)的2行2列的隨機整數
print(np.random.randint(0, 10, size=[2,2]))
# 生成一個[0,1)的隨機數
print(np.random.random())
# 生成[0,1)的2行2列的隨機數
print(np.random.random(size=[2,2]))
# 從給定的列表等概率抽樣10次
print(np.random.choice(['a', 'e', 'i', 'o', 'u'], size=10)) 
# 從給定的列表和對應的概率分布抽樣10次
print(np.random.choice(['a', 'e', 'i', 'o', 'u'], size=10, p=[0.3, .1, 0.1, 0.4, 0.1])) # picks more o's
#> [[ 0.84 0.7 ]
#> [ 0.52 0.8 ]]
#> [[-0.06 -1.55]
#> [ 0.47 -0.04]]
#> [[4 0]
#> [8 7]]
#> 0.08737272424956832
#> [[ 0.45 0.78]
#> [ 0.03 0.74]]
#> ['i' 'a' 'e' 'e' 'a' 'u' 'o' 'e' 'i' 'u']
#> ['o' 'a' 'e' 'a' 'a' 'o' 'o' 'o' 'a' 'o']

6.3 如何得到數組獨特（unique）的項和個數（counts）

np.unique函數去除數組中重復的元素，設置return_counts參數為True，得到數組每一項的個數。

# 定義范圍為[0,10)，個數為10的隨機整數數組
np.random.seed(100)
arr_rand = np.random.randint(0, 10, size=10)
print(arr_rand)
#> [8 8 3 7 7 0 4 2 5 2]
# 得到數組獨特的項和相應的個數
uniqs, counts = np.unique(arr_rand, return_counts=True)
print("Unique items : ", uniqs)
print("Counts : ", counts)
#> Unique items : [0 2 3 4 5 7 8]
#> Counts : [1 2 1 1 1 2 2]

對numpy的基本用法不太熟悉的伙伴，重點可以看一下了！

看完上述內容，你們掌握如何進行Python Numpy的入門的方法了嗎？如果還想學到更多技能或想了解更多相關內容，歡迎關注億速云行業資訊頻道，感謝各位的閱讀！

向AI問一下細節

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

如何進行Python Numpy的入門

猜你喜歡

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

如何進行Python Numpy的入門

猜你喜歡

最新資訊

相關推薦

相關標簽