以下是原理解釋:
電腦底層只能識別數字代碼。文字是怎麽來的?取決於字符集。
人們預先設定壹個標準,用壹些代碼來指代字符。比如網絡上最常見的Unicode編碼,“妳好”的編碼是“\u4f60\u597d”,“u4f60”是“妳”的Unicode編碼。根據這個代碼,計算機系統找到相應的字體(妳可以把它想象成在字典裏查找),並從該字體中選擇“Hello”。
字體(Fonts)也是人很好實現的,比如微軟雅黑,松體,操作系統自帶。字體都支持某種字符集標準(相當於支持某種詞典)
中文字符集常用GB碼,包括妳說的GB18030,GB2312。國外也有自己的字符集,比如英語,德語,阿拉伯語。有些字符集包含多種語言的字符,即國際字符集和Unicode代碼。如果沒有字符集,也就是說手裏沒有字典,代碼就無法解讀。這時候我們看到的單詞是亂七八糟的(因為沒有對應的詞典,系統只會隨機翻譯),而“亂碼”就是這樣產生的。