理论教育 计算机应用基础与案例实训:ASCⅡ码和汉字编码技巧

计算机应用基础与案例实训:ASCⅡ码和汉字编码技巧

时间:2023-11-21 理论教育 版权反馈
【摘要】:目前国际上使用最广泛的字符编码是ASCⅡ码。ASCⅡ码采用7位二进制编码表示1个字符的字符编码。标准的ASCⅡ码一共可以表示27=128种不同字符。区位码一码一字,无重码。机内码是汉字在计算机内的基本表示,是计算机对汉字进行识别、存储、处理和传输所用的编码。换算后的机内码每个字节最高位变成了1,把汉字机内码与ASCⅡ码区分开来。

计算机应用基础与案例实训:ASCⅡ码和汉字编码技巧

【知识链接】

计算机中的信息不单纯是数字,还可以表示为视频、图片、符号等,那么它们如何在计算机内表示呢?

一、认识ASCⅡ码

通过观察下面如表1-5所示的标准ASCⅡ码表,我们来学习字符的ASCⅡ编码。

表1-5 标准ASCⅡ码表

注:(space)表示空格,DEL表示删除。

1.ASCⅡ码的概念

(1)ASCⅡ码是美国信息交换标准代码的简称。目前国际上使用最广泛的字符编码是ASCⅡ码。

(2)ASCⅡ码采用7位二进制编码表示1个字符的字符编码。

(3)标准的ASCⅡ码一共可以表示27=128种不同字符。

(4)在计算机内,每个字符的ASCⅡ码用8位二进制(1个字节)来存储,字节的最高位为校验位,其值为0。

2.ASCⅡ码表的规律

(1)ASCⅡ码由小到大排列规律是:控制字符<空格<数字<大写字母<小写字母。

(2)相邻字符之间相差1。

(3)相应的大小写字母之间相差32,如A为65,a为97。

(4)常见的字符如表1-6所示,只要记住几个字母和数字的ASCⅡ码。

表1-6

二、汉字的编码

1.汉字的处理过程(图1-2)

图1-2

2.汉字的编码类型

计算机在处理汉字过程中有输入码、交换码、机内码、地址码和字形码五种编码。

(1)输入码:输入汉字时使用的编码,输入码有以下几种。

数字编码:区位码。

拼音码:智能ABC。

字形码:五笔字型。

音形码:自然码。

区位码:GB 2312—80字符集,组成一个94×94的矩阵。每一行称为一个“区”,每一列称为一个“位”。一个汉字的区号和位号合在一起构成“区位码”,区位码的编码范围是0101~9494。区位码一码一字,无重码。

(2)交换码(国标码)。

GB 2312—80是交换码的国家标准,是我国1981年颁布的,它用两个字节作为一个汉字编码(16位),且每个字节的最高位为0。国标码常用汉字6763个(一级3755个,按汉语拼音排列;二级3008个,按偏旁部首排列),682个西文字符、图符,总计7445个字符。国际标准信息交换用汉字编码,用于汉字外码和内部码的交换。

国标码=区位码(十六进制)+2020H

国标码的取值范围:2121H~7E7EH。

(3)机内码。机内码是汉字在计算机内的基本表示,是计算机对汉字进行识别、存储、处理和传输所用的编码。

换算后的机内码每个字节最高位变成了1(ASCⅡ码的最高位为0),把汉字机内码与ASCⅡ码区分开来。

(4)字形码(输出码)。字形码表示汉字字形信息的编码,用来实现计算机对汉字的输出。

字形码有点阵码和矢量码两种。

矢量式字形码是描述汉字字形的轮廓特征,与最终文字显示的大小、分辨率无关,因此可以产生高质量的汉字输出。Windows中使用的TrueType技术就是汉字的矢量表示方式。

点阵式字形码是用点表示汉字形状的一种方法,一个点用一个二进制位表示,点的亮、灭两种状态,用一个二进制位的“1”或“0”来对应表示。点阵码缩放困难且容易失真。汉字字形码有16×16、24×24、32×32等点阵编码,如存储一个24×24点阵的汉字字形码需要(24×24)÷8=72个字节。

【课堂练习】

1.已知字符A的ASCⅡ码是01000001B,字符D的ASCⅡ码是( )。

A.01000011B

B.01000100B

C.01000010B(www.daowen.com)

D.01000111B

2.汉字的区位码由一个汉字的区号和位号组成,其区号和位号的范围各为( )。

A.区号1~95位号1~95

B.区号1~94位号1~94

C.区号0~94位号0~94

D.区号0~95位号0~95

3.一个汉字的机内码需用( )个字节存储。

A.4

B.3

C.2

D.1

4.根据汉字国标码GB 2312—80的规定,将汉字分为常用汉字(一级)和次常用汉字(二级)两级汉字。一级常用汉字按( )排列。

A.部首顺序

B.笔画多少

C.使用频率多少

D.汉语拼音字母顺序

5.五笔字型汉字输入法的编码属于( )。

A.音码

B.形声码

C.区位码

D.形码

6.存储一个汉字的机内码需2个字节,其前后两个字节的最高位二进制值依次分别是( )。

A.1和1

B.1和0

C.0和1

D.0和0

7.显示或打印汉字时,系统使用的是汉字的( )。

A.机内码

B.字形码

C.输入码

D.国标交换码

8.存储一个48×48点的汉字字形码,需要( )字节。

A.72

B.256

C.288

D.512

9.在下列字符中,其ASCⅡ码值最大的一个是( )。

A.9

B.Z

C.d

D.E

10.若已知一个汉字的国标码是5E38H,则其内码是( )。

A.DEB8H

B.DE38H

C.5EB8H

D.7E58H

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈