中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

網頁編碼之GB2312、GBK與UTF-8的區別是什么

發布時間:2021-05-18 11:18:43 來源:億速云 閱讀:327 作者:小新 欄目:移動開發

這篇文章給大家分享的是有關網頁編碼之GB2312、GBK與UTF-8的區別是什么的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。

首先,我們要明白,GB2312、GBK和UTF-8都是一種字符編碼,除此之外,還有好多字符編碼。只是對于我們中國人的網站來說,用這三種編碼 比較多。簡單的說一下,為什么要用編碼,在計算機內,儲存文本信息用ASC II碼,每一個字符對應著唯一的ASCII碼。最初計算機是由美國發明的,他們也用的是鍵盤和上面的字母,所以他們的字符ASCII好解決。但是我們中國 的就不同了,每個漢字要對應唯一的ASCII碼。這樣,就出來了國家制定的字符編碼標準:GB2312、GBK等。其他國家,其他語言也有他們對應的編碼 標準。 GB 就是國標的意思,GB2312和GBK主要用于漢字的編碼,而UTF-8是全世界通用的。意思就是說,如果你的網頁主要面對使用漢語的中國人的話,使用 GB2312和GBK非常好,文字儲存體積要小,有一些優點。如果你的網頁要面向世界的話,你再用GB2312和GBK作為網頁編碼的話,有些電腦上的瀏 覽器沒有這種編碼,你的網頁漢字內容就會變成無法識別的亂碼。 它們通常用在網頁的meta標簽內,例如:,表示這個頁面使用的是GB2312編碼。這個信息是給瀏覽器看的,瀏覽器會優先考慮使用從網頁頭部提取出來的編碼信息對網頁進行解碼。當然, 我們也可以強制瀏覽器使用某種編碼解釋網頁,這樣我們就看到了傳說中的亂碼。

GBK、GB2312等與UTF8之間都必須通過Unicode編碼才能相互轉換:

GBK、GB2312--Unicode--UTF8
UTF8--Unicode--GBK、GB2312

對于一個網站、論壇來說,如果英文字符較多,則建議使用UTF-8節省空間。不過現在很多論壇的插件一般只支持GBK。
如果是中文的網站 推薦GB2312 GBK有時還是有點問題 為了避免所有亂碼問題,應該采用UTF-8,將來要支持國際化也非常方便 UTF-8可以看作是大字符集,它包含了大部分文字的編碼。

使用UTF-8的一個好處是其他地區的用戶(如香港臺灣)無需安裝簡體中文支持就能正常觀看你的文字*而不會出現亂碼。*

gb2312是簡體中文的碼
gbk支持簡體中文及繁體中文
big5支持繁體中文
utf-8支持幾乎所有字符

中國大陸最常用的就是GBK18030編碼,除此之外還有GBK,GB2312,這幾個編碼的關系是這樣的。 最早制定的漢字編碼是GB2312,包括6763個漢字和682個其它符號 95年重新修訂了編碼,命名GBK1.0,共收錄了21886個符號。 之后又推出了GBK18030編碼,共收錄了27484個漢字,同時還收錄了藏文、蒙文、維吾爾文等主要的少數民族文字,現在WINDOWS平臺必需要支持GBK18030編碼。

GB2312編碼大約包含6000多漢字(不包括特殊字符),編碼范圍為第一位b0-f7,第二位編碼范圍為a1-fe(第一位為cf時,第二位為a1-d3),計算一下漢字個數為6762個漢字。當然還有其他的字符。包括控制鍵和其他字符大約7573個字符編碼 gbk編碼是對G B2312編碼的擴充,容納的漢字更多,但僅僅是擴充,沒有質的變化。保留了所有G B2312編碼,在此基礎上進行編碼范圍的擴充.容納(包含特殊字符)共22014個字符編碼. gb18030編碼是在gbk編碼基礎上的擴充,因為漢字更多,僅僅使用兩位編碼已經不能 容納要求的漢字,所以采用了2\4位混和的辦法,可以支持更多的漢字編碼。并且保留了原有的gbk 2字節編碼兼容G B2312和gbk編碼的文件。大概容納55657個編碼(包含特殊字符) unicode編碼(也就是UTF編碼):俗稱萬國碼,致力于使用統一的編碼準則表達各國的文字。 為表達更多的文字,utf-8采用2/3混編的方式。目前容納的漢字范圍小于gbk編碼。并且以 3字節的方式處理中文,帶來了兼容性的問題,原有的gbk,G B2312,gb18030編碼文件都不能正常的處理,還有很長的路要走。

gbk和gb2312的區別有哪些

首先大家要了解什么是gbk?什么是gb2312?我們要知道他們都是一種字符編碼,當然字符編碼還有很多種。

而字符編碼我們可以這樣理解:

在計算機中存放的都是0和1的二進制值。

8個位對應一個字節,常用16進制來表示。

那么我們如果想要在計算機上看到我們想要的字符顯示,而不是各種0和1的數字該怎么實現呢?

這里我們就需要使計算機把其所存儲的對應的16進制的數值,轉化為對應的字符,包括英文和中文等其他語言的字符,然后輸出到屏幕上。

所以編碼也就是,定義了一套規則,去指定哪些數值,對應著哪些字符。

那么字符編碼,就是定義了一套規則,指定了計算機中存放的這么多值中的哪個值,對應了電腦屏幕顯示出來的哪個字母。

綜上所述,大家應該都能理解GBK和GB2312是一種字符編碼了吧。

下面我們再具體說說他們的區別與相同點:

相同點:

1、GBK和GB2312 都是16位的!

2、它們通常用在網頁的meta標簽內。

不同點:

1、GBK字符編碼支持簡體中文和繁體中文!

GBK全稱《漢字內碼擴展規范》(GBK即“國標”、“擴展”漢語拼音的第一個字母,英文名稱:Chinese Internal Code Specification) ,中華人民共和國全國信息技術標準化技術委員會1995年12月1日制訂,國家技術監督局標準化司、電子工業部科技與質量監督司1995年12月15日聯合以技監標函1995 229號文件的形式,將它確定為技術規范指導性文件。

2、GB2312只支持簡體中文!

《信息交換用漢字編碼字符集》是由中國國家標準總局1980年發布,1981年5月1日開始實施的一套國家標準,標準號是GB 2312—1980。
GB 2312標準共收錄6763個漢字,其中一級漢字3755個,二級漢字3008個;同時,GB 2312收錄了包括拉丁字母、希臘字母、日文平假名及片假名字母、俄語西里爾字母在內的682個全角字符。

如果你的網頁主要面對使用漢語的中國人的話,使用 GB2312和GBK非常好,文字儲存體積要小,有一些優點。如果你的網頁要面向世界的話,你再用GB2312和GBK作為網頁編碼的話,有些電腦上的瀏覽器沒有這種編碼,你的網頁漢字內容就會變成無法識別的亂碼。 

感謝各位的閱讀!關于“網頁編碼之GB2312、GBK與UTF-8的區別是什么”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

井冈山市| 临夏县| 华亭县| 太康县| 建水县| 黄陵县| 沁阳市| 康平县| 特克斯县| 红安县| 运城市| 鹤庆县| 新郑市| 四子王旗| 白水县| 营口市| 黄石市| 米脂县| 霸州市| 铁力市| 连云港市| 潮安县| 蓝田县| 社会| 屏边| 长顺县| 剑川县| 泸定县| 若羌县| 广西| 平昌县| 平果县| 海安县| 襄汾县| 新平| 广南县| 淮阳县| 凤城市| 迭部县| 安溪县| 富平县|