2.4 汉字输入法

2.4 汉字输入法

2.4.1 汉字输入法概述

最早的汉字输入法,一般认为是从20世纪70年代末期或者80年代初期有了个人电脑PC开始诞生的,虽然更早有电报码,用0~9十个数字中的四位组合构成每一个汉字,便于邮电局发送电报之用,但通常意义上,人们还是认为从PC计算机上开始的用形码如五笔或者音码,如拼音输入汉字才是输入法广为使用的真正开始。

汉字输入法,主要包括拼音、形码、音形码以及手写、语音录入等方法,广义的输入还包括用于速写记录的速录机等。 拼音输入法以智能ABC、中文之星新拼音、微软拼音、拼音之星、紫光拼音、拼音加加、智能狂拼和谷歌拼音等为代表,形码广泛使用者有五笔字型等,音形码有自然码等,手写主要有汉王笔等,语音有IBM的Via Voice等。 电脑终端通常以编码方式的拼音和形码输入为主,而掌上终端包括手机、PDA,各种输入方法亦集成于系统中,除了拼音等编码方式,触摸式手写输入也日渐广泛。

26个英文字母也是我们的拼音文字。 这26个字母排列整齐,有规律。 因此,要将一篇英文资料输入计算机是比较容易的。 但要想输入一篇汉字文章就完全不同了,汉字的字形结构复杂,同音字多,随后汉字输入法随之出现了。

一般情况下,Windows操作系统都带有输入法,在系统装入时就已经安装了一些默认的汉字输入法,例如,微软拼音输入法、智能ABC输入法、全拼输入法等。 当然,用户可以自己选择添加或者删除输入法,通过Windows的控制面板可以实现该功能。 具体操作如下:按开始菜单→设置→控制面板→输入法,之后可以看到输入法属性窗口。 通过其上的添加、删除按钮,可对列表中已有的输入法删除,同时还可以装入新的输入法;通过属性按钮可对各个输入法进行详细的设定。

汉字(中文)输入法,从20世纪80年代发展到今天,已有将近30年的历史,其中尤其以五笔、拼音发展迅速,特别是进入21世纪,具有一定智能程度的拼音输入法,结合了拼音易学、词汇量大、对用户使用设计考虑周详等特点,为广大用户所喜爱,为互联网时代的普及做出了重要贡献。

在输入汉字时要注意的是:键盘处于小写状态时支持汉字的输入。 也就是说汉字输入码全部由小写字母组成。

2.4.2 汉字输入法的基本操作

1)汉字输入的选择

(1)选择汉字输入法最直接的方式

单击任务栏上输入法图标,出现输入法菜单后,单击其中输入法菜单项即可,如图2.4所示。

图2.4 选择输入法

(2)通过键盘进行快速选择汉字输入法

①<Ctrl>+<Shift>:输入法循环切换键(每按一次,变换一种输入法)。

②<Ctrl>+<空格>:中/英文输入法切换键。

注意

在Windows系列操作系统中,汉字输入状态和应用程序是关联的。 例如,当用户在桌面状态下选择了拼音输入方式,若转到画图、写字板或其他应用程序,仍需重新选择汉字输入法。

2)输入法提示条

当输入法启动后,屏幕底部会出现输入法提示条。 对于该提示条,当用户将光标移至其边界时,光标会变为花十字,用户可以按住左键拖动鼠标改变其位置,如图2.5所示。

(1)输入法提示条的组成

输入法提示条的组成如图2.6所示。

图2.5 输入法提示条

图2.6 输入法提示条的组成

①中英文切换按钮。 单击该按钮,将变为“A”,表示进入英文输入方式下,再次单击,则重新切换到中文输入方式,也可按<Caps Lock>键(因此,在“A”状态下只能输入大写字母)。

②输入法名称。 显示当前输入法名称。

③全/半角切换按钮。 用于切换英文字母的全/半角状态。 也可利用<Shift> + <空格键>进行切换。 需要说明的是:全角/半角是英文字符的两种内部编码方式。 全角字符采用二字节汉字编码,半角字符采用单字节ASCII编码。 在显示上,半角字符的宽度是全角字符的一半。

④中/英文标点输入状态。 单击改变标点输入状态,也可按<Ctrl> + <. >键。 表2.4为中文标点输入状态。

表2.4 中文标点输入状态

⑤软键盘。 又称为模拟键盘或动态键盘。 当单击该按钮时,系统将打开一个模拟键盘,用户可以通过它输入汉字或字符,用法和真键盘完全相同。 通常用软键盘输入特殊字符,其方法是:在软键盘上单击右键,选择一种键盘类型,然后即可用键盘输入特殊字符。

注意

输入完特殊字符后,必须将键盘变回“PC键盘”,否则无法正常输入英文或汉字。

(2)使用输入法帮助

将鼠标箭头移到输入法提示条上,单击鼠标右键出现菜单后选择帮助命令即可,如图2.7所示。

3)编码输入框和文字选择框

当输入汉字编码时,系统将打开编码输入框和文字选择框(或重码选择框),如图2.8所示。 如果输入错误,可按<Backspace>删除。 按<Esc>清除所有。

4)选择汉字

按汉字前面对应的数字键,或者也可利用鼠标单击该项。 若汉字处于第1位,可直接按空格键进行选择。

如果重码汉字超过10个,可翻页选择:

①单击文字选择框中标题条上的按钮。

图2.7 输入法帮助菜单

:选择当前编码的第一页;

:选择当前页的上一页;

:选择当前页的下一页;

:选择当前编码的最后一页。

②通过键盘上<->和<+>键向前或向后翻页。

图2.8 编码输入框和文字选择框

注意

(1)许多输入法带有联想功能,所以选择一个汉字后,系统将把与该字有关的词组全部显示出来,供用户可以继续选择。

(2)编码框和文字选择框可以利用鼠标拖动的方法移动位置。 将鼠标移至框中,光标变为花十字,然后拖动鼠标即可。

2.4.3 智能ABC输入法简介

智能ABC输入法和全拼输入法一样也是Windows系统自带的一种拼音输入方法,但它是全拼、简拼、混拼、笔形、音形、双打等多种输入方法的集合。 其规则同上述的全拼输入法完全一样,不同的是:在按词输入时,词与词之间可用空格或者标点隔开。

1)智能ABC输入法的特点

①自动分词和构词。

②自动记忆。

③强制记忆。

④朦胧回忆。

⑤频度调整和记忆。

2)全拼输入

如果对汉语拼音比较熟练,可使用全拼输入法。 按规范的汉语拼音输入,输入过程和书写汉语拼音的过程完全一致。 按词输入,词与词之间用空格或标点隔开。 如果你不会输词,可以一直写下去,超过系统允许的字符个数时,系统将响铃警告。

例如:

woxiɑnɡweiqin’ɑide爱的mɑmɑdiɑnyizhihɑotinɡde听的ɡequ

3)简拼输入

如果你对汉语拼音把握不甚准确,可以使用简拼输入。 取各个音节的第一个字母组成,对于包含zh、ch、sh(知、吃、诗)的音节,也可以取前两个字母组成。

例如:

汉字 全拼 简拼

计算机 jisuɑnji jsj

长城 chɑnɡchenɡ cc,cch,chc,chch

4)混拼输入

汉语拼音开放式、全方位的输入方式是混拼输入。 两个音节以上的词语,有的音节全拼,有的音节简拼。

例如:

汉字 全拼 混拼

金沙江 jinshɑjiɑnɡ jinsj、jshɑj

5)双打输入

智能ABC输入法为专业录入人员提供了一种快速的双打输入。 一个汉字在双打方式下,只需击键两次:奇次为声母,偶次为韵母。 有些汉字只有韵母,称为零声母音节:奇次键入“o”字母(o被定义为零声母),偶次为韵母。 虽然击键为两次,但是在屏幕上显示的仍然是一个汉字规范的拼音。

例如:

汉字 全拼 简拼 双打

明枪暗箭 minɡqiɑnɡ’ɑnjiɑn mq’ɑj MQAJ

图2.9 输入法虚拟键盘

6)自动分词和构词

依照语法规则,把一次输入的拼音字串,划分成若干个简单语段,分别转换成汉字词语的过程,称为自动分词;把这若干个词和词素组合成一个新的词条的过程,称为构词。

例如:要输入“计算机系统”一词,首先输入该词的拼音,如图2.10所示。

图2.10 输入拼音

按空格键,结果如图2.11所示。

因为系统中没有“计算机系统”一词,先分出一个“计算机”并等待选择纠正。 选择“计算机”一词后出现,如图2.12所示结果。

图2.11 选择分词

图2.12 输入法显示结果

分词构词过程完成,一个新的词“计算机系统”被存入暂存区。

7)自动记忆

自动记忆通常用来记忆词库中没有的新词,如人名、地名等。 它的特点是自动进行,或者略加人为干预。 自动记忆的词都是标准的拼音词,可以和基本词汇库中的词条一样使用。

注意

(1)允许记忆的标准拼音词最大长度为9个字,最大词条容量为17000条。

(2)刚被记忆的词并不立即存入用户词库中,至少要使用3次后,才有资格长期保存。 新词栖身于临时记忆栈之中,如果栈“客满”,而当它还不具备长期保存资格的时候,就会被后来者挤出。

(3)刚被记忆的词具有高于普通词语,但低于最常用词的频度。

(4)在自动分词过程中,如果结果与用户需要不符,可用“←BACKSPACE”键或“Enter”键进行干预。

8)强制记忆

强制记忆一般用来定义那些非标准的汉语拼音词语。 利用该功能,可以直接把新词加到用户库中。

注意

(1)强制记忆一个新词,必须输入词条内容和编码两部分。 词条的内容,可以是汉字词、词组或短语,也可以由汉字和其他字符组成;编码可以是汉语拼音、外来语原文,或者是使用者所喜欢的任意标记。

(2)允许定义的非标准词最大长度为15个字,输入码最大长度为9个字符;最大词条容量为400条。

(3)选菜单“定义新词”项,出现如下定义新词对话框,进入强制记忆过程。

9)朦胧回忆

这个功能模拟的是人脑的瞬时记忆以及不完整记忆。 对于刚刚用过不久的词条,可以使用最简单的办法依据不完整的信息进行回忆,这个过程称为朦胧回忆。 朦胧回忆的功能通过“Ctrl”+“-”键来完成。

例如,不久前曾输入:

1基础教育研究会

2上海

3基础科学

4北京

5基本粒子

若想再次输入“基础科学”,先键入“j”,如图2.13所示。

图2.13

再按“Ctrl”+“-”,朦胧回忆扩展屏幕显示,如图2.14所示。

图2.14

10)频度调整和记忆

所谓词的频度,是指一个词使用的频繁程度。 智能ABC标准库中的同音词的词序安排,反映了其使用的一般规律。 但对于不同使用者来说,可能有较大的偏差。 因此,智能ABC设计了词频调整记忆功能。

注意

(1)选中属性设置中的“词频调整”选项后,词频调整就开始自动进行,不需要人为干预。

(2)主要调整默认转换结果,因为系统把具有最高频度值的候选词条作为默认转换结果。

(3)词频调整的词长范围为1~3音节。 对单音节词来说,需要使用两次,词频才发生变化。

11)i、I——中文数量词简化输入

智能ABC提供阿拉伯数字和中文大小写数字的转换能力,对一些常用量词也可简化输入。

“i”为输入小写中文数字的前导字符。

“I”为输入大写中文数字的前导字符。

系统还规定数字输入中字母的含义为:

G[个] S[十,拾] B[百,佰] Q[千,仟]

W[万] E[亿] Z[兆] D[第]

N[年] Y[月] R[日] T[吨]

K[克] ﹩[元] F[分] L[里]

M[米] J[斤] O[度] P[磅]

U[微] I[毫] A[秒] C[厘]

X[升]

例如:

“2005年5月28日”的输入码为“i2005n5y28r”

“贰零零伍年伍月贰捌日”的输入码为“I2005n5y28r”

“壹贰叁肆伍陆柒捌玖零”的输入码为“I1234567890”

12)v——图形符号输入

输入GB2312字符集1~9区各种符号,可使用简便方法:在标准状态下,按字母v+数字(1~9),即可获得该区的符号。

13)v——中文输入过程中的英文输入

在输入拼音的过程中(“标准”或“双打”方式下),如果需要输入英文,可以不必切换到英文方式。 键入“v”作为标志符,后面跟随要输入的英文,按空格键即可。

例如:在输入过程中希望输入英文“Windows”,可输入“v Windows”。

习 题

1.单项题

(1)将十进制数93转换为二进制数为( )。

A.1110111 B.1110101 C.1010111 D.1011101

(2)二进制数101110转换为等值的八进制数是( )。

A.45 B.56 C.67 D.78

(3)下列数中最小的数是( )。

A.(11011001)2B.75 C.(75)8D.(2A7)16

(4)微型计算机中普遍使用的字符编码是( )。

A.BCD码 B.拼音码 C.补码 D.ASCII码

(5)八位无符号二进制整数的最大值对应的十进制数为( )。

A.255 B.256 C.511 D.512

(6)数字字符“8”的ASCII码的十进制表示为56,那么数字字符“4”的ASCII码的十进制表示为( )。

A.51 B.52 C.53 D.60

(7)一个合法的数据只有0至F之间所有的数值表示,该数据应该是( )数据。

A.八进制数 B.十六进制数 C.十进制数 D.二进制数

(8)计算机中数据的表示形式是( )。

A.八进制 B.十进制 C.二进制 D.十六进制

(9)下列英文中,可以作为计算机中数据单位的是( )。

A.bit B.byte C.bout D.band

(10)在计算机中,( )称为一个MB。

A.1000 B.1024 C.1000k B D.1024k B

(11)在微机中,存储容量为5MB,指的是( )。

A.5×1000×1000个字节 B.5×1000×1024个字节

C.5×1024×1000个字节 D.5×1024×1024个字节

(12)400个24×24点阵汉字的字形库存储容量是( )。

A.28800个字节 B.0.23604M个二进制位

C.0.8K个字节 D.288个二进制位

(13)汉字国标码(GB2312—80)规定的汉字编码,每个汉字用( )。

A.一个字节表示 B.二个字节表示

C.三个字节表示 D.四个字节表示

(14)微处理器处理的数据基本单位为字。 一个字的长度通常是( )。

A.16个二进制位 B.32个二进制位

C.64个二进制位 D.与微处理器芯片的型号有关(15)五笔字型输入法属于( )。

A.音码输入法 B.形码输入法

C.音形结合输入法 D.联想输入法

2.填空题

(1)计算机所能辨认的最小信息单位是 。

(2)字符串“大学COMPUTER文化基础”(双引号除外),在机器内占用的存储字节数是____。

(3)根据ASCII码编码原理,现要对50个字符进行编码,至少需要____个二进制位。

(4)存储32×32点阵的汉字字模需要____B。

(5)十进制数183.8125对应的二进制数是____。

(6)“N”的ASCII码为4EH,由此可推算出ASCII码为01001010B所对应的字符是____。

(7)二进制数100110010.11转换成对应的十六进制数是____。

3.判断题

(1)汉字输入时所采用的输入码不同,则该汉字的机内码也不同。 ( )

(2)存储器的基本单位是Byte,1k B等于1024Byte。 ( )

(3)计算机内部存储信息都是由数字0和1组成。 ( )

(4)已知8位机器码10111010,当它是补码时,表示的十进制真值是-75。 ( )

(5)负数的“反码”就是该负数“原码”的各位取反。 ( )