第二章 键盘及汉字输入 本章要点: 键盘介绍 汉字编码及输入 授课方式:采用多媒体教学方式 第一节 键盘的结构及功能 一、键盘的介绍 PC系列微型计算机及各种兼容机的键盘是分离式的,用固定的电缆连接到主机后面的键盘插座(DIN五芯插座)上。键盘按照键的个数不同,分为101键键盘和104键键盘等,目前常用的101键盘示意图如图2-1所示。 1. 键盘组成 2.部分键的功能及使用 (1) 英文字母键 共有26个,用于输入由英文字母组成的程序、文章或汉字。 (2) 数字键 分两组,各有10个。用于输入数字或进行汉字字符选择等。 (3) 符号键 用于输入各种符号,如$、#、%、&、*等。有些符号位于键的上部,要用Shift(上档键)配合符号键进行输入。 (4) 空格键 (5) Shift键(上档键) (6) Ctrl键(控制键) (7) Alt键(选择键) (8) Enter键(回车键) (9) Backspace键(退格键) (10) Tab键(制表键) (11) Caps Lock键 (12) Esc键(取消键) (13) Insert键(插入键) (14) Delete键(删除键) (15) Num Lock键 (16) ↑↓← →键(光标键) (17) Page Up键和Page Down键 二、键盘操作及指法 下面以IBM-PC键盘为例,介绍键盘操作的基本方法。其他型号键盘的主键盘区的操作与之类同,只是字符略有增删,位置略有不同,请参阅有关说明。 1. 正确的姿势 2. 正确的击键指法  3. 键盘应用训练  4.英文输入综合训练 5.数字键的训练 6.速度训练 第二节 汉字输入 计算机在文字信息处理领域已得到广泛应用,为适应信息时代的需要,科技人员必须熟练掌握一种汉字输入方法.本章介绍Windows 98中常用的几种汉字输入法,并重点介绍五笔字型输入法。 一、汉字编码及汉字输人法概述 计算机用于处理汉字信息,必须先对汉字进行编码。汉字编码分为机内码和输入外码。计算机内部进行存储、传输所使用的汉字代码,简称为“内码”,一般情况下机内码不与用户见面。输入汉字使用的汉字编码称为汉字的“外码”,目前较为流行的汉字输入法编码有20余种.“外码”必须通过计算机程序转换为“内码”,才能在计算机内部进行存储和传输。本节介绍机内码和几种简单实用的汉字输入法。 1.区位码 我国制定了《中华人民共和国国家标准信息交换汉字编码》,即GB2312-80《信息交换用汉字编码字符集-基本集》,简称“国标码”。该国标中共收录了汉字和图形符号7445个,其中一级汉字3755个,二级汉字3008个,各种符号、序号、数字、汉语拼音字母与符号、外文字母等682个。GB2312-80将全部国标汉字及图形符号组成一个94×94的矩阵,矩阵中每一行称为一个“区”,每一列称为一个“位”.“区”和“位”分别用两位数字(01~94)编号,区号称为区码,位号称为位码,表中区码和位码组成四位数字,区码居高两位,位码居低两位,称为区位码。94х94的区位码矩阵称为区位码表。 2. 机内码 汉字的机内码是在计算机内部进行存储、传输所使用的汉字代码,是在汉字的区位码基础上演变而来的。如果直接使用区位码为机内码就与ASCII码冲突,为与ASCII码相区别,把每个字节的最高位均置1,相当于加80H;为避开ASCII码的控制码,在区码与位码上分别加20H。于是有如下的编码规则: 高位内码=区码+20H+80H 低位内码=位码+20H+80H 3.区位码输入法 Windows98的区位码输入法覆盖了GB2312-80中规定的全部汉字及图形符号,编码范围是0101~9494。区位码输入法支持GB2312-80的内码输入方式,内码范围为A1A1~FEFE。 把汉字输入法切换到区位码输入法后,键入相应的区位码就可以输入一汉字,如输入“啊”字,则键入1601即可。区位码输入法可以输入区码,再用空格键或“?”键作为查询键查询汉字。例如,输入“啊”时,可键入16,再按空格键,在侯选窗口中显示16区前10个汉字: 1:啊[b0a1,1601] 2:阿[b0a2,1602] 3:埃[b0a3,1603] 4:挨[b0a4,1604] 5:哎[b0a5,1605] 6:唉[b0a6,1606] 7:哀[b0a7,1607] 8:皑[b0a8,1608] 9:癌[b0a9,1609] 0:蔼[b0aa,1610]  二、拼音输入法 1. 全拼拼音输入法 2. 双拼输入法 Windows98内置的双拼输入法简化了全拼输入法的拼音规则,即只用两个字母表示一个汉字,规定声母和韵母各用一个字母,第一次击键的键位取声母;第二次击键的键位取韵母,只要击键二次就可以输入一个汉字的拼音。双拼输入法中,声母和韵母与键位的对应关系如表2-1所示。 表2-1 双拼输入法声韵母键位对照表 键位 a b c d e f g h i j k l m n  声母  b c d  f g h ch j k l m n  韵母 a ou iao uang iang e en eng ang i an ao ai ian in  键位 o p q r s t u v w x y z ;   声母  p q r s t sh zh w x y z    韵母 o uo un iu uan er ong iong ue u ui ue ia ua ie uai ü ei ing   双拼输入法不但可以直接进行单字输入,还支持48000条词汇输入。例如,输入“张”字,键入“vh”,在侯选窗口中出现重码字,选择序号1即可输入“张”。又如,输入“计算机”一词,键入“jisrji”回车即可。对无声母汉字,只击一次韵母键,如“安”的汉语拼音为an,无声母,输入时,键入“j”,选序号2即可。 3. 智能ABC输入法 智能ABC拼音输入过程中,输入结束键为空格或标点符号“:”时,则以词为单位转换信息,输入字串;若为回车键时,将以字为单位转换信息,输入一汉字。输入过程中,任何时候都可按ESC键取消输入的全部内容,重新输入新内容。 在智能ABC拼音输入过程中,如果输入英文,可不必转换到英文方式,只需在英文前加字母“v”即可.例如,需要输入“Windows”,则键入“vWindows”再按回车键,“Windows”就输入到正文中。 在“标准”状态下输入GB2312-80字符集01~09区的各种符号时,键入字母v+数字(1~9),再用翻页键(=或-),在侯选窗口中选取所需的符号。 智能ABC输入法提供了阿拉伯数字和中文大小写数字的转换功能以及一些常用量词的简化输入。“I”和“i”分别为输入大写和小写中文数字的前导字符。例如,键入“I7”(用Shift+i方式输入大写字母I),则输入大写“柒”;键入“i7",则输入小写“七”。在输入中文数字时,为使于输入单位量词,给出下面常用量词编码。 G(个) S(十,拾) B(百,佰) Q(干,仟) W(万) E(亿) Z(兆) D(第) N(年) Y(月) R(日) T(吨) K(克) $(元) F(分) L(里) M(米) J(斤) O(度) P(磅) U(微) I(毫) A(秒) C(厘) X(升) 例如,键入“ise”,则输入“十亿”;键入“Ise”,则输入“拾亿”. 4. 拼音输入过程中自动分词和构词 依照语法,把一个较长的新词语划分成若干个简单语段,分别转换成汉字词语,这一过程称为自动分词;把这若干个词和词素组合成一个新词的过程,称为构词。例如,要输入“计算机系统”一词,键入“jsjxt”,按空格键,输入区显示: 计算机 xt  因为汉字系统中没有“计算机系统”一词,所以先分出“计算机”,等待选择纠正。因计算机是所选部分,所以再按空格键,继续显示后面字词,输入区出现: 计算机系统  分词和构词过程完成,一个新词“计算机系统”被存入智能ABC的词库中。当下次再键入“jsjxt”时,即可直接输入“计算机系统”一词,说明这个词已被系统自动记住了。 三、五笔字型输入法 自1986年五笔字型问世以来,由于五笔字型输入法重码少,输入速度快,一直是目前国内外公认的一种重要的汉字输入法。虽然现在已经有98规范王码输入法在尽力推广应用,但是一般用户都由于习惯于86版的输入方法,再加上98版输入法在操作及规则上都有了较大的变化,所以并非完全保持兼容,因此许多用户仍然在使用86版五笔字型输入法。尽管98王码输入法增加了许多新功能,如屏幕动态取字组词、重码动态调序、码表编辑、汉字内码转换等,但由于与原五笔字型输入法方案的不完全兼容性(资料中称只具有良好的兼容性); 1. 汉字的层次结构 由若干个笔画复合连接、交叉所形成的相对不变的结构称为字根(字元)。字根是构成汉字的基本单位,是汉字的灵魂。例如,“李”是由字根“木”与“子”拼合而成。汉字是由字根按一定位置关系拼合而成,可见汉字的组成可分为三个层次:笔画、字根和单字。 2.汉字的五种笔画 五笔字型编码方案规定,汉字中一笔连续不间断地写成的部分叫做汉字的一个笔画。在笔画分类时,只考虑笔画的运笔方向,而不计其轻重长短,从而把汉字的笔画归结为横、竖、撇、捺、折五种,分别以1、2、3、4、5为代码,如表2-2所示。 表2-2 汉字的五种笔画 代号 名称 笔画定向 笔画及其变形  1 2 3 4 5 横 竖 撇 捺 折 左→右 上→下 右上→左下 左上→右下 带转折 一 丨 丿 丶 乙 乛   3.汉字的基本字根 五笔字型方案经过大量统计和反复试用,最后优选了130个字根作为组字的基本字根,所有汉字可以按一定的规则拆分为这些字根的确定组合,而又不产生多种可能的拆分。因此,这130个基本字根既是组字的依据,也是拆字的依据,是对任何汉字及词汇编码的基本构件。 为了用键盘输入汉字,把130个字根按笔画分为五大区,每区分配五个键位,每个键位又安排若干个字根,基本字根再分为笔形、键名和基本字根,如表2-3所示。 表2-3 五笔字型基本字根总表  4. 字根间的关系 农→冖交农 申→日交 | 里→日交土 果→日交木 必→心交丿 专→二交乙 5 汉字的三种字型 汉字的字型指构成汉字的字根在汉字中排列的位置关系。经过分析、研究,发现成干上万的汉字可归纳分为三种类型:左右型、上下型、杂合型。搞清汉字字根的位置关系,对于确定多字根汉字的类型十分重要。 四、五笔字型字根键盘分布 为了利用标准键盘输入汉字,五笔字型汉字编码方案把130个基本字根按起笔画分为五大区,其区号依次为1、2、3、4、5,与起笔画代号相同.每区占五个键位,每个键位安排一类字根,其位号依次为1、2、3、4、5。于是,11~15代表横起笔的字根;21~25代表竖起笔的字根;31~35代表撇起笔的字根;4145代表捺起笔的字根;51~55代表折起笔的字根。根据字根出现的频度,分别将基本字根分配在标准键盘的A~Y25个字母键位上。五笔字型基本字根键盘的分布如图2-3所示。 为便于高频字的输入,又从每个键的基本字根中选出一个形体上有一定代表性的字根,作为一个键的链名,其键名字根如下: 一区(横起笔):王土大木工 二区(竖起笔):目日口田山 三区(撇起笔):禾白月人金 四区(捺起笔):言立水火之 五区(折起笔):已子女又纟(“纟”可读丝音) 由图2-3五笔字型字根键盘总图可以看出,分布在同一键位上的字根具有很强的规律性,字根间在形、音、义等方面能产生所需要的联想。熟练掌握下面的键盘特征,有助于快速记忆字根的键位。 ①使字根首笔画代号与所在区号一致,如王、大、方、广等。 ②使相当一部分字根的第二笔画代号与位号一致,如王、戈等的第一笔为横,代号为1,与区号一致,第二笔也是横,代号为l与位号一致,因此这些字根的区位号或字根代号为11(G)。  1.横起笔区(1区) 字根助记词为: G(11) 王旁青头戈(兼)五一 F(12) 土士二干十寸雨(不要忘记“革”字底) D(13) 大犬三羊()古石厂(“羊”指字底) S(14) 木丁西 A(15) 工戈草头右框七(草头指“艹”,,右框指“匚”) 2. 竖起笔区(2区) 字根助记词如下. H (21) 目具上止卜虎皮 J (22) 日早两竖与虫依 K(23) 口与川,字根稀 L (24) 田甲方框四车力 M(25) 山由贝,下框几 3.撇起笔区(3区) 字根助记词如下: T (31) 禾竹一撇双人立,反文条头共三一 R(32) 白手看头三二斤 E(33) 月彡(衫)乃用家衣底 W(34) 人和八,三四里 Q(35) 金勺缺点无尾鱼,犬旁留儿一点夕,氏无七(妻) 4.捺起笔区(4区) 字根助记词如下: Y(41) 言文方广在四一,高头一捺谁人去 U(42) 立辛两点六门疒 I (43) 水旁兴头小倒立 O(44) 火业头,四点米 P(45) 之字军盖道建底,摘礻(示) 衤(衣) 5.折起笔区(5区) 字根助记词如下: N(51) 已半巳满不出己,左框折尸心和羽 B(52) 子耳了也框向上 V(53) 女刀九臼山朝西 C(54) 又巴马,丢矢矣 X(55) 慈母无心弓和匕,幼无力 五、五笔字型编码规则 掌握了五笔字型编码基础和基本字根后,还需熟练掌握五笔字型编码规则,才能写出任意汉字的五笔字型输入码。熟记如下编码口诀,有助于快速掌握编码规则。 五笔字型均直观, 依照笔顺杷码编; 键名汉字打四下, 基本字根请照搬; 一二三末取四码, 顺序拆分大优先; 不足四码要注意, 交叉识别补后边。 上述口决概括了五笔字型拆分取码的五个原则: ①以基本字根为取码单位,单体结构拆分取大优先; ②按书写顺序,从左到右、从上到下、从外到内取码; ③按一二三末字根,最多取四码; ④不足四个字根,补末笔字型交叉识别码; ⑤键名汉字编码为四个键名。 五笔字型编码原则总结在图2-4中。 1.汉字拆分原则 (1) 取大优先。 (2) 兼顾直观 (3) 能散不连 (4) 能连不交 2.末笔字型交叉识别码 3.键名汉字编码 4.成字字根编码 5.键外单字编码 6.简码 (1) 一级简码 在五笔字型的25个键位中,根据每个键位上的字根特征,每键安排一个最常用的高频汉字。输入这25个高频汉字时,只需击一个字母键再加击一空格键即可。 一级简码字如下: 一G 地F 在D 要S 工A 上H 是J 中K 国L 同M 和T 的R 有E 人W 我Q 主Y 产U 不 I 为O 这P 民N 了B 发V 以C 经X (2) 二级简码 二级简码由单字的前两个字根代码组成。由于两码中的每一码都可由25个键位中的任意一个组成,故可安排二级简码25×25=625个,五笔字型编码方案实际安排的使用频率较高的二级筒码汉字约600个。二级简码字如表2-6所示。 (3) 三级简码 由单字的前三个字根代码组成的编码称为三级简码。只要一个汉字的前三个字根代码在所有汉字编码中是唯一的,一般都选作三级简码,三级简码有汉字4400个。输入三级简码汉字时,只需键入三个字根代码,再加空格即可。虽然末减少击键次数,但省略了第四个字根或交叉识别码的判定,提高了编码速度,从而提高了输入速度。例如,“深”的全码为IPWS,三级简码为IPW。 7.词汇码 六、重码与容错码的处理 1. 重码处理 2.容错码 Z键的使用