2014年计算机一级MSOffice第一章考点解析8-2 |
来源:2exam.com 2014-3-5 9:12:35 |
2.汉字的编码 ASCIl码只对廷文字母、数字和标点符号进行了编码。为了使计算机能够处理、显示、打印、 交换汉字字符,同样也需要对汉字进行编码。我国于1980年发布了国家汉字编码标准GB 2312--80,全称是《信息交换用汉字编码字符集一基本集》(简称GB码或国标码)。根据统计,把最常用的6763个汉字分成两级:一级汉字有3 755个,按汉语拼音字母的次序排列;二级汉字有3 008个,按偏旁部首排列。由于一个字节只能表示256种编码,是不足以表示6763个汉字的,所以一个国≯示码用两个字节来表示一个汉字,每个字节的最高位为0。 为避开ASCIl码表中的控制码,将GB 2312—80中的6 763个汉字分为94行、94列,代码表分94个区(行)和94个位(列)。由区号(行号)和位号(列号)构成了区位码。区位码最多可以表示94x94=8836个汉字。区位码由4位十进制数字组成,前两位为区号,后两位为位号。在区位码中,01~09区为特殊字符,10~55区为一级汉字,56~87区为二级汉字。例如汉字 “中”的区位码为54 48,即它位于第54行、第48列。 区位码是一个4位十进制数,国标码是一个4位十六进制数。为了与ASCIl码兼容,汉字输入区位码与国标码之间有一个简单的转换关系。具体方法是:将一个汉字的十进制区号和十进制位号分别转换成十六进制;然后再分别加上20H(十进制就是32),就成为汉字的国标码。例如,汉字“中”字的区位码与国标码及转换如下: 区位码 5448D (3630)H 国标码8680D (3630H+20 20H)=5650H, 二进制表示为:(00110110 00110000)B+(00100000 00100000)B=(01010110 01010000)B 世界上使用汉字的地区除了中国内地,还有中国台湾及港澳地区、日本和韩国,这些地区和 国家使用了与中国内地不同的汉字字符集。中国台湾、香港等地区使用的汉字是繁体字即 BIG5码。 1992年通丈£的国际标准IS0 10646,定义了一个用于世界范围各种文字及各种语言的书面 形式的图形字符集,基本上收全了上面国家和地区使用的汉字。Unicode编码标准对汉字集的处理与IS0 10646相似。 GB 2312—80中因有许多汉字没有包括在内,为此有了GBK编码(扩展汉字编码),它是对 GB 2312—80的扩展,共收录了21 003个汉字,支持国际标准IS0 10646中的全部中日韩汉字, 也包含了BIG5(台、港、澳)编码中的所有汉字。GBK编码于1995年12月发布。目前Windows以上的版本都支持GBK编码,只要计算机安装了多语言支持功能,几乎不需要任何操作就可以 在不同的汉字豸、统之间自由变换。“微软拼音”、“全拼”、“紫光”等几种输入法都支持GBK字符集。2001年我国发布了GB l8030编码标准,它是GBK的升级,GB l8030编码空间约为l60万码位,目前已经纳入编码的汉字约为2.6万个。
|
网站版权与免责声明
①由于各方面情况的不断调整与变化,本网所提供的相关信息请以权威部门公布的正式信息为准.
②本网转载的文/图等稿件出于非商业性目的,如转载稿涉及版权及个人隐私等问题,请在两周内邮件fjksw@163.com联系. |
|
|
|