[PHP] UTF8 簡繁轉換

UTF-8 最大的一個特點,就是它是一種長度不固定的編碼方式。它可以使用 1~6個 bytes 表示一個字元,根據不同的字元而變化 byte 長度。 

在 2003年11月UTF-8被RFC 3629重新規範,只能使用原來Unicode定義的區域,也就是最多 4 bytes ( U+0000到U+10FFFF )。

UTF-8的編碼規則很簡單,只有二條:

1)對於 1 byte 的字元,byte 的最高 bit 設為 0,後面 7 位為這個字元的 unicode碼。因此對於英語字母來說,UTF-8 編碼和 ASCII 碼是相同的。

繼續閱讀 “[PHP] UTF8 簡繁轉換”