您好,登錄后才能下訂單哦!
這篇文章主要介紹“怎么理解Java字符編碼”,在日常操作中,相信很多人在怎么理解Java字符編碼問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”怎么理解Java字符編碼”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!
在計算機中,任何的文字都是以指定的編碼方式存在的,在 Java 程序的開發中最常見的是 ISO8859-1、GBK/GB2312、Unicode、 UTF 編碼。
(1)ISO8859-1:屬于單字節編碼,最多只能表示 0~255 的字符范圍。
(2)GBK/GB2312:中文的國標編碼,用來表示漢字,屬于雙字節編碼。GBK 可以表示簡體中文和繁體中文,而 GB2312 只能表示簡體中文。GBK 兼容 GB2312。
(3)Unicode:是一種編碼規范,是為解決全球字符通用編碼而設計的。UTF-8 和 UTF-16 是這種規范的一種實現,此編碼不兼容 ISO8859-1 編碼。Java 內部采用此編碼。
(4)UTF:UTF 編碼兼容了 ISO8859-1 編碼,同時也可以用來表示所有的語言字符,不過 UTF 編碼是不定長編碼,每一個字符的長度為 1~6 個字節不等。一般在中文網頁中使用此編碼,可以節省空間。
如果在程序中處理不好字符編碼,就有可能出現亂碼問題。例如現在本機的默認編碼是 GBK,但在程序中使用了 ISO8859-1 編碼,則就會出現字符的亂碼問題。就如同兩個不同國家的人用自己的母語交流,語言不同就無法溝通。所以為了避免產生亂碼,程序編碼應與本地的默認編碼保持一致。
public static Properties getProperty() //可以查看當前系統使用默認編碼
代碼示例:
public static void main(String[] args) {
// 獲取當前系統編碼
System.out.println("系統默認編碼:" + System.getProperty("file.encoding"));
}
編碼錯誤案例:
public class Test {
public static void main(String[] args) throws Exception {
File f = new File("D:" + File.separator + "test.txt");
// 實例化輸出流
OutputStream out = new FileOutputStream(f);
// 指定ISO8859-1編碼
byte b[] = "C語言中文網,你好!".getBytes("ISO8859-1");
// 保存轉碼之后的數據
out.write(b);
// 關閉輸出流
out.close();
}
}
運行結果如下:
由此可見,由于編碼不一致,所以在保存時出現了亂碼。
到此,關于“怎么理解Java字符編碼”的學習就結束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續學習更多相關知識,請繼續關注億速云網站,小編會繼續努力為大家帶來更多實用的文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。