理论教育 汉字输入码和内码:定义和作用

汉字输入码和内码:定义和作用

时间:2023-11-19 理论教育 版权反馈
【摘要】:汉字输入码为将汉字输入计算机而编制的代码称为汉字输入码,也叫外码。汉字输入码是利用计算机标准键盘上按键的不同排列组合来对汉字的输入进行编码。不同的输入码通过输入字典转换成统一的标准国标码。一个汉字的内码用2个字节来存储,并把每个字节的最高位二进制位置“1”作为汉字内码的标识,避免与单字节的ASCII码产生歧义。汉字字形码汉字字形码又称为汉字字模,其功能是使汉字显示或打印。

汉字输入码和内码:定义和作用

(1)汉字输入码

为将汉字输入计算机而编制的代码称为汉字输入码,也叫外码。汉字输入码是利用计算机标准键盘上按键的不同排列组合来对汉字的输入进行编码。目前常用的输入法类别有:音码、形码、语音输入、手写输入或扫描输入。实际上,区位码也是一种输入法。

不同的汉字使用不同的输入法,不同的输入法有不同的输入码,例如汉字“文”字,其全拼输入码是“WEN”,其五笔输入码是“YYGY”。不同的输入码通过输入字典转换成统一的标准国标码。

(2)汉字内码

汉字内码是在计算机内部对汉字进行存储、处理的汉字代码,它应能满足存储、处理和传输的要求。一个汉字的内码用2个字节来存储,并把每个字节的最高位二进制位置“1”作为汉字内码的标识,避免与单字节的ASCII码产生歧义。国标码和内码的关系可表示为:内码=将国标码的每个字节加上一个80H。例如,汉字“火”的国标码为3B70H,3BH+80H=BBH,70H+80H=F0H。汉字火的内码即BBF0H,转换为二进制为

(1011101111110000)B

(3)汉字字形码

汉字字形码又称为汉字字模,其功能是使汉字显示或打印。描述字形的方法主要有两种:点阵字形和矢量表示方式。

点阵字形就是用排列成方阵的点的黑白来描述汉字。用点阵表示字形时,汉字字形码指的就是这个汉字字形点阵的代码。

输出的汉字要求不同,点阵的多少也不同。简易型汉字为16×16点阵,普通型汉字为24×24点阵,提高型汉字为32×32点阵、48×48点阵。

在计算机中,点阵规模越大,字形越清晰美观,但所占的存储空间也越大。8个二进制位组成一个字节,它是度量空间的基本单位。可见,一个32×32点阵的字形码转换成字节就是32×32/8=128个字节。(www.daowen.com)

矢量表示方式存储的是描述汉字字形的轮廓特征。Windows中使用的TrueType技术就是汉字的矢量表示方式,解决了汉字点阵字形放大后出现锯齿现象的问题。

(4)汉字地址码

汉字地址码是指汉字库中存储汉字字形信息的逻辑地址码。

(5)其他汉字内码

GBK编码(拓展汉字编码)是对国标码的补充,GB2312—80中未能收录的汉字使用GBK编码。2001年,我国发布了GB18030编码标准,是GBK的升级,其编码空间有160万码位,目前已经收录的汉字约有2.6万个。

UCS编码(通用多八位编码字符集)是国际标准化组织

(ISO)为各种语言字符制定的编码标准。

Unicode编码是另一个国际编码标准。目前,可容纳65536个字符编码,主要用来解决多语言的计算问题。

BIG5码是中国台湾、香港地区使用的繁体字编码标准。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈