在C#中,Unicode和UTF-8都是用來表示字符編碼的方式。Unicode是一種字符集,定義了每個字符對應的唯一代碼點,而UTF-8是一種編碼方式,用來將Unicode字符編碼為字節序列。
在C#中,可以使用Encoding.Unicode
和Encoding.UTF8
類來進行Unicode和UTF-8編碼的轉換。下面是一個示例代碼:
using System;
using System.Text;
class Program
{
static void Main()
{
string unicodeString = "你好";
// 將Unicode字符串編碼為UTF-8字節序列
byte[] utf8Bytes = Encoding.UTF8.GetBytes(unicodeString);
Console.WriteLine("UTF-8 bytes: " + BitConverter.ToString(utf8Bytes));
// 將UTF-8字節序列解碼為Unicode字符串
string decodedString = Encoding.UTF8.GetString(utf8Bytes);
Console.WriteLine("Decoded string: " + decodedString);
}
}
在上面的示例中,我們首先將Unicode字符串"你好"編碼為UTF-8字節序列,然后將UTF-8字節序列解碼為Unicode字符串。可以看到,通過使用Encoding.UTF8
類,我們可以方便地進行Unicode和UTF-8之間的轉換。