Python整數與Numpy數據溢出問題解決

發布時間：2020-09-20 22:46:25 來源：腳本之家閱讀：342 作者：豌豆花下貓欄目：開發技術

某位 A 同學發了我一張截圖，問為何結果中出現了負數？

看了圖，我第一感覺就是數據溢出了。數據超出能表示的最大值，就會出現奇奇怪怪的結果。

然后，他繼續發了張圖，內容是 print(100000*208378)，就是直接打印上圖的 E[0]*G[0]，結果是 20837800000，這是個正確的結果。

所以新的問題是：如果說上圖的數據溢出了，為何直接相乘的數卻沒有溢出？

由于我一直忽視數據的表示規則（整型的上限是多少？），而且對 Numpy 了解不多，還錯看了圖中結果，誤以為每一個數據都是錯誤的，所以就解答不出來。

最后，經過學習群里的一番討論，我才終于明白是怎么回事，所以本文把相關知識點做個梳理。

在正式開始之前，先總結一下上圖會引出的話題：

Python 3 中整數的上限是多少？Python 2 呢？
Numpy 中整數的上限是多少？出現整數溢出該怎么辦？

關于第一個問題，先看看 Python 2，它有兩種整數：

一種是短整數，也即常說的整數，用 int 表示，有個內置函數 int()。其大小有限，可通過sys.maxint() 查看（取決于平臺是 32 位還是 64 位）
一種是長整數，即大小無限的整數，用 long 表示，有個內置函數 long()。寫法上是在數字后面加大寫字母 L 或小寫的 l，如 1000L

當一個整數超出短整數范圍時，它會自動采用長整數表示。舉例，打印 2**100 ，結果會在末尾加字母 L 表示它是長整數。

但是到了 Python 3，情況就不同了：它僅有一種內置的整數，表示為 int，形式上是 Python 2 的短整數，但實際上它能表示的范圍無限，行為上更像是長整數。無論多大的數，結尾都不需要字母 L 來作區分。

也就是說，Python 3 整合了兩種整數表示法，用戶不再需要自行區分，全交給底層按需處理。

理論上，Python 3 中的整數沒有上限（只要不超出內存空間）。這就解釋了前文中直接打印兩數相乘，為什么結果會正確了。

PEP-237（Unifying Long Integers and Integers）中對這個轉變作了說明。它解釋這樣做的目的：

這會給新的 Python 程序員（無論他們是否是編程新手）減少一項上手前要學的功課。

Python 在語言運用層屏蔽了很多瑣碎的活，比如內存分配，所以，我們在使用字符串、列表或字典等對象時，根本不用操心。整數類型的轉變，也是出于這樣的便利目的。（壞處是犧牲了一些效率，在此就不談了）

回到前面的第二個話題：Numpy 中整數的上限是多少？

由于它是 C 語言實現，在整數表示上，用的是 C 語言的規則，也就是會區分整數和長整數。

有一種方式可查看：

import numpy as np
a = np.arange(2)
type(a[0])
# 結果：numpy.int32

也就是說它默認的整數 int 是 32 位，表示范圍在 -2147483648 ~ 2147483647。

對照前文的截圖，里面只有兩組數字相乘時沒有溢出：100007*4549、100012*13264，其它數據組都溢出了，所以出現奇怪的負數結果。

Numpy 支持的數據類型要比 Python 的多，相互間的區分界限很多樣：

Python整數與Numpy數據溢出問題解決

截圖來源：https://www.runoob.com/numpy/numpy-dtype.html

要解決整數溢出問題，可以通過指定 dtype 的方式：

import numpy as np
q = [100000]
w = [500000]
# 一個溢出的例子：
a = np.array(q)
b = np.array(w)
print(a*b) # 產生溢出，結果是個奇怪的數值
# 一個解決的例子：
c = np.array(q, dtype='int64')
d = np.array(w, dtype='int64')
print(c*d) # 沒有溢出：[50000000000]

好了，前面提出的問題就回答完了。來作個結尾吧：

Python 3 極大地簡化了整數的表示，效果可表述為：整數就只有一種整數（int），沒有其它類型的整數（long、int8、int64 之類的）
Numpy 中的整數類型對應于 C 語言的數據類型，每種“整數”有自己的區間，要解決數據溢出問題，需要指定更大的數據類型（dtype）

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支持億速云。

向AI問一下細節

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

Python整數與Numpy數據溢出問題解決

猜你喜歡

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

Python整數與Numpy數據溢出問題解決

猜你喜歡

最新資訊

相關推薦

相關標簽