【知识链接】
计算机中的信息不单纯是数字,还可以表示为视频、图片、符号等,那么它们如何在计算机内表示呢?
一、认识ASCⅡ码
通过观察下面如表1-5所示的标准ASCⅡ码表,我们来学习字符的ASCⅡ编码。
表1-5 标准ASCⅡ码表
注:(space)表示空格,DEL表示删除。
1.ASCⅡ码的概念
(1)ASCⅡ码是美国信息交换标准代码的简称。目前国际上使用最广泛的字符编码是ASCⅡ码。
(2)ASCⅡ码采用7位二进制编码表示1个字符的字符编码。
(3)标准的ASCⅡ码一共可以表示27=128种不同字符。
(4)在计算机内,每个字符的ASCⅡ码用8位二进制(1个字节)来存储,字节的最高位为校验位,其值为0。
2.ASCⅡ码表的规律
(1)ASCⅡ码由小到大排列规律是:控制字符<空格<数字<大写字母<小写字母。
(2)相邻字符之间相差1。
(3)相应的大小写字母之间相差32,如A为65,a为97。
(4)常见的字符如表1-6所示,只要记住几个字母和数字的ASCⅡ码。
表1-6
二、汉字的编码
1.汉字的处理过程(图1-2)
图1-2
2.汉字的编码类型
计算机在处理汉字过程中有输入码、交换码、机内码、地址码和字形码五种编码。
(1)输入码:输入汉字时使用的编码,输入码有以下几种。
数字编码:区位码。
拼音码:智能ABC。
字形码:五笔字型。
音形码:自然码。
区位码:GB 2312—80字符集,组成一个94×94的矩阵。每一行称为一个“区”,每一列称为一个“位”。一个汉字的区号和位号合在一起构成“区位码”,区位码的编码范围是0101~9494。区位码一码一字,无重码。
(2)交换码(国标码)。
GB 2312—80是交换码的国家标准,是我国1981年颁布的,它用两个字节作为一个汉字编码(16位),且每个字节的最高位为0。国标码常用汉字6763个(一级3755个,按汉语拼音排列;二级3008个,按偏旁部首排列),682个西文字符、图符,总计7445个字符。国际标准信息交换用汉字编码,用于汉字外码和内部码的交换。
国标码=区位码(十六进制)+2020H
国标码的取值范围:2121H~7E7EH。
(3)机内码。机内码是汉字在计算机内的基本表示,是计算机对汉字进行识别、存储、处理和传输所用的编码。
换算后的机内码每个字节最高位变成了1(ASCⅡ码的最高位为0),把汉字机内码与ASCⅡ码区分开来。
(4)字形码(输出码)。字形码表示汉字字形信息的编码,用来实现计算机对汉字的输出。
字形码有点阵码和矢量码两种。
矢量式字形码是描述汉字字形的轮廓特征,与最终文字显示的大小、分辨率无关,因此可以产生高质量的汉字输出。Windows中使用的TrueType技术就是汉字的矢量表示方式。
点阵式字形码是用点表示汉字形状的一种方法,一个点用一个二进制位表示,点的亮、灭两种状态,用一个二进制位的“1”或“0”来对应表示。点阵码缩放困难且容易失真。汉字字形码有16×16、24×24、32×32等点阵编码,如存储一个24×24点阵的汉字字形码需要(24×24)÷8=72个字节。
【课堂练习】
1.已知字符A的ASCⅡ码是01000001B,字符D的ASCⅡ码是( )。
A.01000011B
B.01000100B
C.01000010B(www.daowen.com)
D.01000111B
2.汉字的区位码由一个汉字的区号和位号组成,其区号和位号的范围各为( )。
A.区号1~95位号1~95
B.区号1~94位号1~94
C.区号0~94位号0~94
D.区号0~95位号0~95
3.一个汉字的机内码需用( )个字节存储。
A.4
B.3
C.2
D.1
4.根据汉字国标码GB 2312—80的规定,将汉字分为常用汉字(一级)和次常用汉字(二级)两级汉字。一级常用汉字按( )排列。
A.部首顺序
B.笔画多少
C.使用频率多少
D.汉语拼音字母顺序
5.五笔字型汉字输入法的编码属于( )。
A.音码
B.形声码
C.区位码
D.形码
6.存储一个汉字的机内码需2个字节,其前后两个字节的最高位二进制值依次分别是( )。
A.1和1
B.1和0
C.0和1
D.0和0
7.显示或打印汉字时,系统使用的是汉字的( )。
A.机内码
B.字形码
C.输入码
D.国标交换码
8.存储一个48×48点的汉字字形码,需要( )字节。
A.72
B.256
C.288
D.512
9.在下列字符中,其ASCⅡ码值最大的一个是( )。
A.9
B.Z
C.d
D.E
10.若已知一个汉字的国标码是5E38H,则其内码是( )。
A.DEB8H
B.DE38H
C.5EB8H
D.7E58H
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。