第二章中英文输入基础
? 指法练习
? 汉字系统
? 智能全拼输入法介绍
? 五笔字型输入法介绍
2.1指法练习
2.1.1击键姿势
2.1.2击键要领
2.1.3基本键位
2.1.4指法分工
2.1.5指法练习
第一节 指法练习
2.1.1 正确的姿势
目的:可以提高速度、准确率并且不易疲劳
身体坐姿
包括两面方面:
击键的方式

2.1.2 基本键位
A S ;LKJFD
小指
左手
无名指 中指 小指无名指中指食指 食指
右手

2.1.3 指 法 分 工
第一节 指 法 练 习
3两手拇指

1.讲究方法,循序渐进
2.注重准确率
3.注意力集中
2.1.4 练 习 方 法
第二节 汉 字 系 统
汉字处理的原理 UCDOS汉字系统
2.2.1 汉字处理的原理
1.汉字编码(非数值型)
(1)汉字划分(70年代)
* 一级汉字:3755,99.9%
* 二级汉字:3008,99.99%
(2)国标码GB2312-80
<<信息交换用汉字编码字符集基本集 >>
对汉字进行编码
包括一级、二级汉字和 682个其他字符 5
(3)汉字编码表(便于检索)
* 双字节七位编码方案
* 94行、94列的一个表(8836)
(4)汉字编码种类
区位码:编码表中的行号为区,列号为位,(DEC)
国标码:双字节七位编码,用十六进制表示
内码:两个字节的高位均为1的国标码

2.汉字输入
(1)输入码(外码) ----汉字输入时的代码
汉字输入技术主要表现在汉字的输入方式及输入
码的处理。汉字输入方式有多种,但目前使用最多的
仍是随机配置的键盘输入。
键盘上无一汉字,为什么用户能利用键盘键入汉
字?实际上,用户输入的并不是汉字本身,而是汉字
代码,统称输入码或外码,外码就是与某种汉字编码
方案相应的汉字代码。
输入汉字前,用户可以根据需要选定一种汉字外
码作为输入汉字时使用的代码,如拼音、五笔、自然
码等。然后再按选定的外码所规定的编码规则把汉字、
词输入进去。如中国两个汉字,区位码是 5448和 2590,
拼音码是 zhong和 guo,五笔型代码是 khlg,这些都是
外码,它是用户利用键盘进行输入的一种代码,这种
代码位于人机界面之间。 7
在汉字系统启动时,自动加载
能够完成汉字输入时的汉字识别、接收和
转换
(2)汉字输入驱动程序
3.汉字存储 汉字的存储通常采用 内码 方式

ASCII字符和汉字都是以代码方式存储在内存或磁盘上的。 ASCII
字符的存储比较简单,一个 ASCII字符占用 1个字节作为代码,1
个字节由 8个二进制位组成,可以表示 256个不同的代码,标准的
ASCII字符只有 128个,因此只取低 7位进行编码,将高位置成 0,
并规定前 32个代码是控制码,是不可见字符。如换行、回车、响
铃、同步等,只起控制作用,表示执行了某个动作。国标码有几
千个字符和汉字,显然用 1个字节表示不下,至少需要 2个字节,
目前,微机存储一个内码固定为连续的 2个字节。如果把 GB
2312-80字符集中的区位码直接用作内码,当表示某个汉字的 2个
字节处在低数值时( 0- 31),系统很难判定是 ASCII控制码还是
汉字内码,不易区分。为防止发生这种现象,把区码和位码数值
各加十进制数 32即十六进制数 20,以避免与 ASCII控制码混淆,
这样还没有解决根本问题,仍不能与 ASCII码完全区分开来。
ASCII码与汉字同属一类,都是文字信息。系统很难辨别连续的 2个字节
代表的是 2个 ASCII字符还是 1个汉字。为解决这个问题,现在的汉字系
统中普遍采用把表示 1个汉字的 2个字节首位(最高位)都固定置成 1,
等于把每个字节在已经增加十进制数 32的基础上再加上 128,这样才能
与 ASCII码彻底区分,这种编码称作内码。除特殊情况外,无论用户使
用哪台微机,启动哪种汉字系统,利用哪种汉字输入法,计算机存储的
内码都是唯一的,因此内码具有通用性。
如汉字 啊,区位码是 1601,内码则是 B0A1,下面用区位码和内码分别表
示汉字 啊 。
通过上面的例子很容易找出区位码与内码之间的关系,即在区位码的基
础上 2个字节分别加十进制数 160( 32+128)就是内码。
用十进制数表示区位码 啊 是 1601
0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1
1 0 1 1 0 0 0 0 1 0 1 0 0 0 0 1
用十六进制数表示内码 啊是 B0A1
4.汉字显示(点阵) * 英文(8*8)点阵
* 中文(16*16)点阵
计算机显示的字符(包括汉字)由点组成,可以用点
阵描述字符的笔画,如果用二进制的 0代表屏幕上的暗
点,1代表亮点,那么任何一个字符都可以用一串二进
制的数表示,这种方法称作点阵的数字化。
每个汉字需要 32字节,每列占两个字节,共 16行

总之, 2个字节的首位固定为 1,2个字节后 7位联合
起来的不同组合 ( 除每个字节前 32种组合外 ), 用
来存储 GB2312-80字符集中一个字符或汉字内码, 字
符和汉字总计收录了 7445( 6763+682) 个, 因此用
2个字节编码完全有扩充余地 。

* 显示过程:
将汉字的内码调入内存,确定
汉字字模的起始地址
5.汉字打印
* 打印字库:24*24 72bytes(3*24)
32*32 通用型
48*48
64*64
96*96 精密字库
128*128
* 一个24点阵汉字需要72个字节(3*24)
一行为3个字节,共24列
10
2.2.2 UCDOS汉字系统
1.主要模块和文件
* 核心模块:RD16,COM
KNL.COM
* 输入法模块:PY,COM/BAT
WB.COM/BAT
JP.COM/BAT
2.UCDOS启动,UCDOS.BAT
UP.BAT(打印驱动)
3.UCDOS退出,QUIT
11
第三节 智能全拼输入法
1.输入法介绍
* 以 <<汉语拼音方案 >>为基础定义的输入方法
* 采用小写字母 a--z
2.输入法启动(DOS)
PY.COM/BAT
3.输入方法
(1)单字:键入需要输入汉字的拼音,选择重码数字即可
(2)词组:连续输入各个字的拼音,也可只输入声母
* 拼音中间无空格,超过 5个字时,只输入前 5个的拼音
4.造词,输入全部拼音,系统会自动记录
删除:用SHIFT+重码数字即可 12
2.4 五笔字型输入法介绍
2.4.1 汉字的结构分析
1,汉字的五种笔画
2,笔画组成字根的相互关系
3,字根
4,字根与汉字的相互关系
5,汉字的三种字型
1.汉字的五种笔画
汉字归纳为五种笔画,即 横、竖、撇、捺、
折, 根据其使用频度依次用数字 1,2,3,4、
5进行编号。注意:
?, 提笔, 因其笔画走向为从左到右而视为横,
例如:“现”字的王字旁的末笔为提视为横;
?, 点, 属于捺,例如:“林”字的最后一画视
为捺;
?, 竖左钩, 属于竖,例如:“于”字的最后
一画视为竖 ;
? 一切带拐弯 的笔画,都归为折类。
2,笔画组成字根的相互关系
? 单, 即五种笔画本身。例:一,|;
? 散,组成字根的笔画之间有一定的间距。例:
三、八;
? 连,组成字根的笔画之间是互相连接的。 例:
厂、人;
? 交,组成字根的笔画是相互交叉的。 例,十、
力、又等;
? 混合型,一个字根各笔画之间既有连又有交
或散。 例:纟、禾等。
3,字根
?键名字根
在五笔字型编码方案中,每一个英文字母键上一般
安排了 2个至 6个基本字根,从中选出一个具有代表性
的字根定义为键名字根,共有 25个,分别为,王土大木
工、目日口田山、禾白月人金、言立水火之、已子女
又纟 。安排在五笔字型字根总图上每个键位的左上角。
?成字字根
在五笔字型字根表中,除键名字根外,本身就是一
个汉字的字根称为成字字根。例如,用、西、雨、九
等 。
?辅助字根
在五笔字型字根表中,除键名字根及成字字根外的
其它字根均为辅助字根。例如,冂、阝、彐等 。
五笔字型字根分布图
4,字根与汉字的相互关系
一切汉字都是由基本字根拼合而成的,基本字根在
组成汉字时,按照它们之间的位置关系可以分为五种
类型。
单,基本字根本身就是一个汉字。例:口、木、
田等;
散,组成汉字的基本字根之间有一定的间距。例:
吕、汉、位等;
连,一个单笔画和一个基本字根相连。例:“且”
字由“月”与“一”相连,另外带点结构均视为连,
而不论点与字根的远近、连与不连。例:术、太等;
交,几个基本字根交叉套迭之后构成的汉字。例:
农、里等;
混合型,一个汉字由几个基本字根组成,它们之间
既有连的关系,又有交的关系,例:丙、两等。
5,汉字的三种字型
根据构成汉字的各字根之间的位置关系,在五笔字
型编码方案中,把汉字分为 左右型、上下型和杂合型
三种字型,分别用代号 1,2,3表示。
汉字的字形是区分某些汉字在拆分时,由于组成汉
字的字根是一样的,但字根的排列位置不一样而形成
不同的汉字。例如:“只”与“叭”、“吧”与“邑”
等。
综上所见,根据汉字的结构分析与字型分类,可归纳
以下几点:
? 基本字根就是汉字,不需要判断字型或上下型;
? 属于“散”结构的汉字,可以分为左右型或上下型;
? 属于“连”或“交”结构的汉字,一律属于杂合型 ;
? 不分左右也不分上下结构的汉字,一律属于杂合型,
2.4.2 五笔字型字根表
1.五笔字型字根表
横区 1
竖区 2
撇区 3
捺区 4
折区 5
1位
3位
4位
5位
3,字根在键盘上的分布规律
2.字根的区位码
2位
五笔字型字根分布图
字根在键盘上的分布规律
在五笔字型字根键盘总表中,每个键位上一般安
排了 2~6个字根,这些字根的安排一般具有如下特征:
1,字根的首笔代号与其所在的区号一致,次笔代号
与其所在的位号一致。 例如:“王”字:首笔为
“一”,代号为 1,所以在 1区,次笔为“一”,代号为 1,
所以在 1位,因此“王”字在 1区 1位。
2,字根的首笔代号与其所在的区号一致,笔画数目
及其外形与其所在的位号一致。
3,某些字根与主要字根形态相近或渊源一致,与主
要字根安排在同一键上,例如:“士”、“干”与键
名字根“土”形态相近,故安排在同一键位上。
4.个别例外:笔划特征与所在区、位号不相符合。
同时与其它字根之间又缺乏联想性的字根有:“车”、
“力”在,24/L”键上 (繁体“车”与“甲”相似,“力”
的声母为,L”)。
“心”在,51/N”键上 (“心”字最长的笔画为折笔 )。
五笔字型编码方案字根 区
位表
位号 1位 2位 3位 4位 5位
横区 1 王 G

土 F

大 D


S

A
竖区 2 目 H

日 J

口 K

四 L 山 M
撇区 3 禾 T
丿
白 R 月 E

人 W 金 Q
捺区 4 言 Y

立 U

水 I

火 O

之 P
折区 5 己 N

子 B

女 V

又 C 纟 X
2.4.3 字根汉字的输入法
1,键名汉字的输入法
每个键位左上角的字根为键名字根 。例如:王,gggg 目,hhhh 禾:
tttt 言,yyyy
2,成字字根汉字的输入法
(1) 除了键名字根之外,本身也是汉字的字根称为成字字根。
(2) 输入方法是:
? 报户口,即首先打一下成字字根它本身所在的那个键;
? 再打该字根的第一画、第二画及最末一画所对应的键的编码;
? 字根不足三画时,补打一个空格键;
3,单笔画的输入法
在五笔字型中,横、竖、撇、捺、折这五种单笔画也可输入到计算机
中,它们的输入方法是:打两下单笔画所在的键,再打两下,L”键,
五种单笔画的编码如下,
一,ggll 丨,hhll 丿,ttll 丶,yyll 乙,nnll
2.4.4 合体汉字的输入方法
定义, 除键名汉字及成字根汉字以外的其
它任何汉字 。
按书写顺序的原则
1.合体汉字的
拆分原则
能连不交的原则
能散不连的原则
取大优先原则
笔画勿断的原则
1.合体汉字的拆分原则
合体汉字可视为由基本字根拼合组成,所以一切合体汉字必须拆
成基本字根后,才能输入 。
对合体汉字的拆分制定出几条原则 。 它们是:按书写顺序, 能散
不连, 兼顾直观, 能连不交, 取大优先, 笔画勿断 。
l 按书写顺序的原则
一般汉字的书写原则为先上后下, 先左后右, 先外后内, 那么拆
分汉字时也应遵循这一原则 。
l 能散不连的原则
在五笔字型拆分时, 左右结构及上下结构的汉字均为散的关系,
所以它们的拆分比较容易 。 但是有些汉字拆成基本字根时, 字根之
间初看起来像连的关系实为散的关系 。 在五笔字型中, 只有单笔画
与基本字根之间的关系才视为连 。 例如:
,占, 字拆分成, 卜, 和, 口,,初看, 卜, 和, 占, 是相连的,
但根据五笔字型中定义连接的关系为一个单笔画与基本字根相连才
能是连的关系 。 所以这两个字根不是连的关系应看成散的关系 。
l 兼顾直观的原则
在拆分汉字时, 要兼顾汉字的完整性, 即看起来比较直观, 不能
把一个汉字拆的太零散 。 例如:
,国, 字应拆成, 口,,“王, 和,,, 三个字根,而不能拆成,
冂,,“三,,和, 一, 。
l 能连不交的原则
一个汉字能按连接关系拆分, 就不要按相交的关系拆分 。 例如:
,天, 字应拆成, 一, 和, 大,, 看成这两个字根为相连的关系
,而不应该拆成, 二, 和, 人,, 这两个字根为相交的关系 。
l 取大优先原则
取大优先原则是在汉字的各种可能的拆分方法中, 在保证前几条
拆分原则的前提下, 拆出尽可能大的字根 。 它包括两点含义:
(1) 拆分汉字时,拆出的字根数目最少;
(2) 拆分出的字根笔画数多即最大字根 。
这里所讲的最, 大, 字根是指以增加一笔画不能形成已有的字根,
减少一笔画又不能以最大来决定笔画分组 。 例如:
,乱, 字应拆分成, 丿,,“古,,“乙,,而不能拆分成, 丿,,“
十,,“口,,“乙,
2.合体汉字的编码规则
合体汉字按照上述我们讲过的拆分原则拆分之后,还要按照
五笔字型的编码规则进行编码,才能把汉字输入到计算机中。
五笔字型的编码规则有如下的歌诀:
五笔字型均直观, 依照笔顺把码编;
键名汉字打四下, 基本字根请照搬;
一二三末取四码, 顺序拆分大优先;
不足四码要注意, 交叉识别补后边 。
这就概括了五笔字型拆分取码的六项规则,
l 笔画勿断的原则
上述五项原则是五笔字型的拆分原则,但是在拆分中还应
注意一个完整的汉字笔画不能割断,用在两个或两个以上的
字根中 。 例如:
,里, 字也应拆成, 日, 和, 土,,而不应拆成, 田, 和
,土, 。
取码顺序按书写顺序,从左到右,从上到下,从外到内的原则;
l 键名汉字打四下的原则;
l 任何字根,只要属于同一键位,则它们在任何字的任何部
位都用同一个代号,按同一个键,这即是基本字根请照搬。
l 汉字拆分后的字根数大于等于 4个字根时,只取一二三末四
个字根,即最多只取四码的原则;
l 汉字拆分时以取最大字根为优先的原则;
l 汉字拆分后,不足四个字根时,要加打末笔字型交叉识别
码的原则。
例如:四个字根以上的汉字, 输, 字取字根, 车,,, 人,,
,一, 及, 刂, ;编码,lwgj,字根, 月, 不考虑。
注:( 1)不足四个字根汉字的输入方法:
一个汉字拆分后,不足四个字根时,其输入方法是:先按顺序打完
拆出的字根所对应的键,再追加一个末笔字型交叉识别码,简称
识别码,如果还不足四码,再打一个空格键。
( 2)识别码的组成是由汉字的, 末笔画, (作区号)与字型代号
(作位号)组合而成,实际输入时使用这两个代号组成的字根区
位号所对应的英文字母键。, 末笔字型交叉识别, 只适用于不足
四个字根组成的字。例如:
叭:拆分成, 口,,, 八,,末笔为捺字型左右结构,识别码为
41,对应键为 Y,故此字的编码为 KWY +空格。
2.4.5 五笔字型汉字编码流程
2.4.6 简码输入
为了减少击键次数,提高汉字的输
入速度,对于一些常用的汉字,除了按
全码可以输入外,还可只取其前边一个,
两个或三个字根的编码,再加打一空格
键,形成简码输入。
简码输入
一级简码
二级简码
三级简码
一级简码
? 定义:打一个字母键再打一个空格键即可打出一个汉字。
? 一级简码 25个,如下所示:
一 11( G)地 12( F)在 13( D)要 14( S)工 15( A)
上 21( H)是 22( J)中 23( K)国 24( L)同 25( M)
和 31( T)的 32( R)有 33( E)人 34( W)我 35( Q)
主 41( Y)产 42( U)不 43( I)为 44( O)这 45( P)
民 51( N)了 52( B)发 53( V)以 54( C)经 55( X)
二级简码
? 二级简码:只打一个汉字的前两个字根
或编码,再打一个空格键也可以打出一
个汉。
? 这些汉字为二级简码,约有 600多个。
? 如:如、打、汉等等。
三级简码
? 三级简码:有些汉字只要打该字的前三个字
根或编码,再加打一个空格键即可输入 。
? 这些汉字为三级简码,约有 4400多个。
? 并没有减少总共的击键次数,但由于省略了
最末一个字根或,末笔字型交叉识别码, 。
? 例如:
华:亻、匕、十、凵( WXF凵)
操:扌、口、凵( RKK凵)
注意:有的汉字可能属于几种编码。如:经
2.4.7万能学习键,z”
1.代替识别码。
当某个汉字需要末笔字型交叉识别码时,
若识别码一时搞不准,可用,z”代替 。 如,只
kwz.
2.代替拆分的字根编码 。
当某个汉字在拆分时一时记不清或分解
不准的任何字根,均可用,z”键代替 。如:
清 ize
3.查阅简码。
可以用,z”键来查阅同一汉字有无简码
或简码汉字有哪些。 如,yzzz。
2.4.8 词组的输入
1,双字词组的编码
两个汉字组成的词组叫做双字词组。编码取法为:
按顺序分别取两个字的前两个字根代码,共四码组
成。
例如:计算,YFTH 项目,ADHH 机器,SMKK
工厂,AADG
注意:如果组成词组的汉字是单根字,取码时这个
字要按照单根字输入法取码,如“项目”中的
“目”,“工厂”中的“工”,“厂”。
2,三字词组的编码
3,四字和四字以上的词组编码
三字词组的编码
? 编码取法为,先在前两个汉字的编码中,
各取第一个代码,然后在第三个汉字的编码
中取前两个代码,共四码组成。
? 例,思想上:“思”字的第一个字根是
“田”,代码 L,“想”字的第一个字根是
“木”,代码为 S,“上”字是单根字,前两
个编码是 HH,所以词组“思想上”的编码是
LSHH。
? 计算机,YSTM 解放军,QYPL 动物园:
FTLF 共青团
3,四字和四字以上的词组编码
? 取码方法为,分别取第一、第二、第三
和最末汉字的编码中的第一个代码,按取码
顺序排列,组成四码。
? 例:科学技术,TIRS 麻痹大意:
YUDU 联系群众,BTVW 程序设计,TYYY
? 中华人民共和国:多字词组,在前三个
字和最末一个字上各取第一个代码,得到的
四个编码为 KWWL。