您好,登錄后才能下訂單哦!
如何分析C語言數據的存儲,很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。
數據類型存在的意義
為變量開辟的空間大小(大小決定了使用范圍)
取數據的時候按照什么格式取出(先看大小端,在看數據類型(用來解析二進制數據的方式))
char
unsigned char
signed char
short
unsigned short [int]
signed short [int]
int
unsigned int
signed int
long
unsigned long [int]
signed long [int]
注意:默認的char,short,int 在VS都是signed
……
float
double
數組
結構體
枚舉
聯合體
int* pi;
char* pc;
void* pv;
void 表示空類型,沒有給定類型
通常應用于指針類型
我們都知道 int類型的數據在內存中被分配了四個字節的空間,那么他們在內存中如何存儲呢?
int a = 20;
int b = -10;
計算機中的整數有三種表示方法,即原碼、反碼、補碼
原碼:直接將十進制按照正負數的形式翻譯成二進制就可以
反碼:將原碼的符號位不變,其他位取反即可得到
補碼:反碼 + 1
注意:整數的 原反補 相同
對于整形數據來說,在內存中存的其實是補碼,為什么?
使用補碼,可以將符號位和數值域統一處理,同時,加法和減法可以統一處理(CPU只有加法器),不需要額外的硬件電路,減少了開銷
看看變量在內存中的存儲:
我們會看到a,b存儲的是補碼,但是字節的順序有點有對,這就是整形數據存儲的大小端問題,也叫字節序問題
大端存儲:數據的低位保存在內存的高地址中,而數據的高位,保存在內存的低地址中
小端存儲:指數據的低位保存在內存的低地址中,而數據的高位,,保存在內存的高地址中
存在的原因:
我們都知道在計算機系統中,都是以字節為單位的,每個地址單元管理一個字節的空間大小,但是在C語言中如 int 有4字節等,所以對于32位或者64位的處理器來說,就必然存在著4個字節的排放順序,因此就出現了大小端存儲的問題,也成為字節序問題,上述代碼就是小端存儲(VS底下的代碼)
百度2015年系統工程師筆試題:
請簡述大端字節序和小端字節序的概念,設計一個小程序來判斷當前機器的字節序。
// 代碼1 - 利用char類型的指針一次訪問一個字節的特性 #include <stdio.h> int check_sys() { int i = 1; return (*(char *)&i); } int main() { int ret = check_sys(); if(ret == 1) { printf("小端\n"); } else { printf("大端\n"); } return 0; } //代碼2 - 聯合體 int check_sys() { union { int i; char c; }un; un.i = 1; return un.c; }
1. #include <stdio.h> int main() { char a = -128; printf("%u\n",a); return 0; }
2. int i= -20; unsigned int j = 10; printf("%d\n", i+j); // 這里就是i+j是個表達式,先算表達式的值,在%d打印 // 表達式計算的時候是基于補碼進行的,跟類型是無關的 // 11111111 11111111 11111111 11101100 // 00000000 00000000 00000000 00001010 // -------------------------------------+ // 11111111 11111111 11111111 11110110 - 計算后的補碼 // 10000000 00000000 00000000 00001010 - 最后結果-10
3. int main() { char a[1000]; int i; for(i=0; i<1000; i++) { a[i] = -1-i; } printf("%d",strlen(a)); return 0; }
補充
存:字面數據必須先轉成補碼,在放入空間當中。所以,所謂符號位,完全看數據本身是否攜帶±號。和變量是否有符號 無關!
取:取數據一定要先看變量本身類型,然后才決定要不要看最高符號位。如果不需要,直接二進制轉成十進制。如果需 要,則需要轉成原碼,然后才能識別。(當然,最高符號位在哪里,又要明確大小端)
3.14159,1E10(1^10)都是我們常見的浮點數,而C語言中定義的浮點數有float和double常見的兩種類型,兩種類型范圍被定義在頭文件float.h中
看上面代碼,我們很容易發現num和*pfloat在內存明明訪問的是同一塊空間,為什么浮點數和整數的解讀差別這么大呢,下面我們講講浮點數的存儲規則。
國際IEEE(電氣和電子工程協會)754規定,任何一個二進制浮點數V都可以表示成下面的形式:
(-1)^S * M * 2^E
(-1)^S表示符號位,S=0時,表示正數;S=1時,表示負數
M表示有效數字,1 <= M <2
E表示指數位
十進制5.0,寫成二進制101.0,科學計數法:1.01 * 2^2
S = 0,M = 1.01,E = 2
十進制的-5.0,寫成二進制是 -101.0 ,相當于 -1.01×2^2 。那么,s=1,M=1.01,E=2
前面說過, 1 <= M < 2 ,也就是說,M可以寫成 1.xxxxxx 的形式,其中xxxxxx表示小數部分。
IEEE754規定,在計算機內部保存M時,默認這個數的第一位總是1,因此可以被舍去,只保存后面的xxxxxx部分。比如保存1.01的時候,只保存01,等到讀取的時候,再把第一位的1加上去。這樣做的目的,是節省1位有效數字。以32位浮點數為例,留給M只有23位,
將第一位的1舍去以后,等于可以保存24位有效數字。
至于指數E,情況就比較復雜。
首先,E為一個無符號整數(unsigned int)
這意味著,如果E為8位,它的取值范圍為0255;如果E為11位,它的取值范圍為02047。但是,我們 知道,科學計數法中的E是可以出
現負數的,所以IEEE 754規定,存入內存時E的真實值必須再加上一個中間數,對于8位的E,這個中間數 是127;對于11位的E,這個中間
數是1023。比如,2^10的E是10,所以保存成32位浮點數時,必須保存成10+127=137,即 10001001。
E不全為0或不全為1
這時,浮點數就采用下面的規則表示,即指數E的計算值減去127(或1023),得到真實值,再將 有效數字M前加上第一位的1。 比如:
0.5(1/2)的二進制形式為0.1,由于規定正數部分必須為1,即將小數點右移1位,則為
1.0*2^(-1),其階碼為-1+127=126,表示為 01111110,而尾數1.0去掉整數部分為0,補齊0到23位00000000000000000000000,
則其二進制表示形式為: 0 01111110 00000000000000000000000
E全為0
這時,浮點數的指數E等于1-127(或者1-1023)即為真實值,
有效數字M不再加上第一位的1,而是還原為0.xxxxxx的小數。
這樣做是為了表示±0,以及接近于 0的很小的數字。
E全為1
這時,如果有效數字M全為0,表示±無窮大(正負取決于符號位s);
int main() { int n = 9; float *pFloat = (float *)&n; printf("n的值為:%d\n", n); printf("*pFloat的值為:%f\n", *pFloat); *pFloat = 9.0; printf("num的值為:%d\n", n); printf("*pFloat的值為:%f\n", *pFloat); return 0; }
這里我們會發現%d打印浮點數的時候結果為0
而%lld打印的結果和double存儲變量的結果一樣的
原因:
在可變長參數函數(例如printf函數)或者不帶原型聲明函數中,在調用該函數時C自動進行類型提升(在調用函數時如果聲明這個函數那么則不會提升),提升如下:
float類型的實際參數將提升到double
char、short和相應的signed、unsigned類型的實際參數提升到int
如果int不能存儲原值,則提升到unsigned int 然后,調用者將提升后的參數傳遞給被調用者。
C標準對默認實際參數提升規則有明確規定。也就是說, 帶有可變長參數列表的函數,
絕對不會接受到char類型的實際參數。
看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注億速云行業資訊頻道,感謝您對億速云的支持。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。