浅谈字符集GB18030, GBK, GB2312, Unicode的适应性范围

发布时间 2023-05-31 15:15:16作者: 峋山隐修会

目前在中文世界里,计算机系统发展非常快速,传统的Windows已经逐渐跟不上国产化,如国产安卓系统,华为欧拉鸿蒙等系列,国产Linux系统等。

国产化普遍支持GB18030!

注: GB 18030标准符合性认证一度属于国家强制性标准,由中国电子技术标准化研究所(CESI)认证中心进行授权认证。

那么这些字符集标准哪些在中文世界里适用性范围更广呢?

从集合概念来讲:

GB18030 > Unicode > GBK > GB2312

从使用平台来讲

国产化系统 > 国外系统(Windows,MacOSX,Linux,Ubuntu等) > 旧系统(WinXP, WIN 98等)

有时候会发现,在国产化系统中保存的文档,会在Windows上出现无法识别的字符,原因就在于此:

如目前Windows仍然使用GBK,即使是自带的Unicode也只收录了GBK字符集,又如华为手机采用ISO标准的Unicode,其中收录的中文字符集是参考GB18030中的中文部分(不完全,PUA区域标准不同),范围已经是大于微软采用的GBK。

可以简单认为Windows的自带Unicode字符集是残缺的,因为长期以来都只收录了GBK字符集,已经不能适应当今快速发展的计算机时代。