2010-5-20 第 6章句法 (语法 )与语义理论及分析 1
6.1 句法分析与用作翻译的理论基础
6.2 其它相关语法介绍
6.3 语法分析在机器翻译中的应用
6.4 汉语和英语语法的概述
6.5 语义分析
第 6 章 句法(语法)与语义理论及分析
下页
2010-5-20 第 6章句法 (语法 )与语义理论及分析 2
6.1 句法分析与用作翻译的理论基础
下页
(1)确定输入句子的结构句法分析要识别构成句子的各
个成分以及它们之间的相互关系,例如确定每个动词的
主语和宾语,以及每个修饰性的词或短语所修饰的成分,
通常这是通过给每个输入句子构造一则句法来完成的。
(2)句法结构的规范化,如果我们把大量的输入结构映射
为数量较少的结构,那么后继处理 (例如语义分析 )就得
以简化。
6.1.1句法分析的任务
句法分析有两个 主要 任务,
2010-5-20 第 6章句法 (语法 )与语义理论及分析 3
1>句子中常有些成分可以被省略 ; 所
谓句子结构的规范化就是把这些省略的
信息补上。
2>各种转换可以把结构不同的句子变得
相同,例如主动语气和被动语气。 这样
一类转换使后继处理只考虑数量少得多
的结构 。
下页
6.1 句法分析与用作翻译的理论基础
2010-5-20 第 6章句法 (语法 )与语义理论及分析 4
结构规范化是否应由句法分析模块来完成一直有争议,
理论语言学倾向于限制句法分析模块完成这一任务,认为
这是词法分析过程不应由句法分析来处理,某些计算语言
学家则完全放弃了句法结构的规范化,而让语义分析模块
直解去处理各式各样的句子结构。在这一类系统中,句法
结构的规范化实际上被包含在语义分析过程中了。但是这
样做确实要求更复杂的语义规则,因此在自然语言处理系
统中一般的做法仍然包含这样一种结构规范化的模块。
下页
6.1 句法分析与用作翻译的理论基础
2010-5-20 第 6章句法 (语法 )与语义理论及分析 5
在一个机器翻译理解系统中,句法分析要不要作为一个独
立的分析阶段存在?这个问题同样有争议,因为在现有的
系统中,不外乎有以下两种处理方法,
(1)先句法后语法,强调在语言分析过程中存在一个相对独
立的句法分析阶段,结果是句子的一棵句法结构树。在经
过语义分析模块的处理,获得该句子的某种意义表示,当
然在句法分析中偶尔也需要利用附加在词和短语上的某些
必要的语义信息,但它主要依据是句法范畴 (即词类和短语
标记等 )那样的形式特征。实践证明,这类句法分析的设
计可以不依赖某个特定的应用领域,因而具有好的可扩展
性和可移植性。这是当前大多数系统采用的分析策略。
下页
6.1 句法分析与用作翻译的理论基础
6.1.2句法分析是否必要
2010-5-20 第 6章句法 (语法 )与语义理论及分析 6
(2)句法 -语义一体化 (或并行 ):这种分析方法不再单独设
臵一个句法分析模块,也不出现句法结构树这样一种中间
的分析结果。在这类系统中,句子分析所依据的形式特征
与其说是句法范畴,还不如说是语义范畴。一体化分析策
略的主要论据是心理学方面的合理性,即面对那些有语法
错误或信息不全的句子,人们往往可以根据语义线索来获
得句子的解释,对于比较复杂的句子,没有句法指导,语
义分析往往难以奏效。而且对于忽视句法分析的观点持批
评态度的人也可以举出另外一些例子说明重视句法也同样
具有心理学根据,比如人们时常在不知道一个词的意义时
仅仅根据句法规则来判明这个词在句子中的功能。
下页
6.1 句法分析与用作翻译的理论基础
2010-5-20 第 6章句法 (语法 )与语义理论及分析 7
6.1.3上下文无关语法
在一部上下文无关语法中,每条规则都采用如下形式,A→x
其中,A∈N,x∈V*,即每条产生式的左则必须是一个单独
的非终结符。在这种形式体系中,规则被应用时不依赖于符
号 A所处的上下文,因此称为上下文无关语法。
下例,S→aSc S→b 是上下文无关语法。
只要改变一下规则中的符号,令
S→(S) S→x 便可生成成对括号表达式,x,(x),
((x)),(((x))),((((x))),…
下页
6.1 句法分析与用作翻译的理论基础
2010-5-20 第 6章句法 (语法 )与语义理论及分析 8
上下文无关语法正是以这种方式解决了正则
语法不可能解决的嵌套结构。
上下文无关语法广泛应用于程序设计语言和自
然语言描写中。在专业文献中,时常看到用 (BNF)
表达上下文无关语法,它同表示短语结构语法的标
记略有不同。在 BNF中,用尖括号标明非终结符,
可以用符号 "::="代替 "→" 。此外,如果有两条或
更多的产生式具有相同的左侧,它们可以作为一条
单独的 BNF定义被聚集在一起,并用符号 "│" 分隔。
下页
6.1 句法分析与用作翻译的理论基础
2010-5-20 第 6章句法 (语法 )与语义理论及分析 9
因此上例生成成对括号表达式的产生式规则,可
表示为,
<S>::=(<S>)│x
除了表达上下文无关语法以外,还时常需要
表达句子的推导。推导显示一个特定句子怎样根
据语法规则生成。可以把推到表示为产生式应用
的一个程序。
下页
6.1 句法分析与用作翻译的理论基础
2010-5-20 第 6章句法 (语法 )与语义理论及分析 10
举例,如果有语法
<SENTENCE>,:=<SUBJECT><VERBPHRASE> (1)
<SUBJECT>,:=Jone│Mary (2)
<VERBPHRASE>::=<VERB><O (3)
<VER>,:=eats│drinks (4)
<OBJECT>,:=wine│chee (5)
可以把句子 "Mary eats cheese"的推导表示如下,
<SENTENCE>→<SUBJECT><VERBPHRASE>
→Mary<VERBPHRASE>
→Mary<VERB><OBJECT>
→Mary eats <OBJECT>
→Mary eats cheese
6.1 句法分析与用作翻译的理论基础
下页
2010-5-20 第 6章句法 (语法 )与语义理论及分析 11
以上下文无关文法为基础的,一个串到串的
映射称为句法引导的翻译。 形式上,从字母表 ∩
上的语言 L1到字母表△上的语言 L2的翻译是一个
在 L1× L2中的关系 T。 对于在 T中的翻译对 (x,y),
即说输入串 x被翻译成输出串 y。 [注意 ]一个给定
的输入可能会有任意数量的,互不相同的输出翻译。
5.1.4 句法引导的翻译理论模型
6.1 句法分析与用作翻译的理论基础
下页
2010-5-20 第 6章句法 (语法 )与语义理论及分析 12
如果把 "翻译单元 "赋给上下文无关文法的每个产
生式,就可以得到翻译系统的形式模型,这个系统
可产生句法引导的翻译。在一般的上下文无关文
法中,一个产生式是形式为 A→a 的项,它表示导
出 ∩ +中的句子时,非终极符 A可以用 a来代替。为
实现句法引导的翻译,有必要考虑两个同时出现
的导出。第一个导出得到 ∩ + 中的输入串 x,第二
个导出得到 x的翻译,也就是在△ +中的输出串 y。
6.1 句法分析与用作翻译的理论基础
下页
2010-5-20 第 6章句法 (语法 )与语义理论及分析 13
为产生第二个导出,把形式为 A→a 的输入产生式和形
式为 A→β 的输出产生式合并,就得到 A→α,β 的重写规
则。 A→α,β 表示,在输入串的导出中,非终极符 A可
以用 α 代替,同时,在输出的导出中,可以用 β 代替 A,
即,对重写规则 A→α,β 来说,β 是 α 的翻译单元。
上述性质的理论模型为句法引导的翻译系统, 简写 SDTS,
且为一个五元组 J=(N,∩,△,R,S),其中,N为非终
极符的有限集 ; ∩ 是有穷的输入字母表 ; △ 是有穷的输
出字母表 ; R是规则的有穷集 ; S是在 N中,是起始符。
R的元素形式 A→α,β 。 在每个规则中,α 中的某
个非终极符在 β 中必须有一个对应的替换串。在 α 中的每
一个非终极符,在 β 中都有一个与之联系的,相对应的非
终极符。
6.1 句法分析与用作翻译的理论基础
下页
2010-5-20 第 6章句法 (语法 )与语义理论及分析 14
STDS的输入文法是 Gi=(N,∩,Pi,S),具有产生式
Pi={A→α│A→α,β 在 R中 }
输出文法是 Go=(N,△,Po,S),具有产生式
Po={A→β│A→α,β 在 R中 }
SDTS的思路是,用 Gi求在 ∩ 上的导出,同时通过规则,用
Go求在△上的导出。仅当 (x,y)是一个翻译时,在 L(Gi)
中的输入串 x才能被翻译成在 L(Go) 中的输出串 y。因为
在 L(Gi)中的每个句子,在 L(Go)中至少有一个对应的串。
6.1 句法分析与用作翻译的理论基础
下页
2010-5-20 第 6章句法 (语法 )与语义理论及分析 15
翻译集合 J的定义,
τ(J)={(x,y)│x 在 L(Gi)中,y在 L(Go)中,
(x,y)是一个翻译形式 }
这个翻译集合 τ(J) 是 L(Gi)× L(Go)中的一个关
系。 通常,对于一个给定的 x,可以有不止一个 y
使得 (x,y)是在 τ(J) 中,因此翻译过程是不确
定的。
在句法引导的翻译中,把输入句子翻译成输出句
子时,有两种情况会引起歧义性,
6.1 句法分析与用作翻译的理论基础
下页
2010-5-20 第 6章句法 (语法 )与语义理论及分析 16
第一种:是上下文无关文法中的歧义性概念的直接推广。
在 τ(J) 中,如果至少存在一个翻译形式 (x,y),使得
在使用输入文法时存在两个或更多个各不相同的 x最左导
出,而它们产生出相同的输出串 y,那么,这个 STDS是歧义
的。这时虽然产生相同的翻译,但为产生这个翻译,所用的
基本句法可能是不同的 ;
第二种:输入串 x产生多个输出串。即,如果在 L(Gi)中
至少存在一个输入串 x,使得在 τ(J) 中至少存在两种翻译
形式 (x,y1),(x,y2),并且,y1≠y2,那么,这个 STDS
在翻译时是歧义的。
下页
6.1 句法分析与用作翻译的理论基础
2010-5-20 第 6章句法 (语法 )与语义理论及分析 17
如果一个系统中存在两个不同的行式为
A→α,β 和 A→α,γ 的规则,则说明这些
规则反映了语义歧义性。 即,使用输入文
法中的产生式 A→α 时,输出文法提供了或
A→β,或 A→γ 的选择性。
下页
返回
6.1 句法分析与用作翻译的理论基础
2010-5-20 第 6章句法 (语法 )与语义理论及分析 18
6.2.1 短语结构语言
定义 1,一个句子是一个符号串,这个串由选自某
种语言词汇表中的一个或多个符号 (词 )组成。
定义 2,一种语言是一个句集,它包含了属于这种语
言的全部句子。
定义 3,一部语法是对一个句集的一种有限的形式化
描述。
6, 2 其它相关语法介绍
下页
2010-5-20 第 6章句法 (语法 )与语义理论及分析 19
语法可采用不同形式来定义。如果一种语言只包含
有限句子,那么可以通过逐一枚举的方式来定义。
然而大多数有研究价值的语言通常都拥有无限多个
句子。描述这类语言的方法之一是编一部程序,然
后读入一个符号串,让机器判断是不是一个句子。
这样的程序叫做这种语言的识别器。另一种描述方
法是利用一种基于产生式的形式化工具。这种被广
泛用来描写形式语言和自然语言的工具被称为产生
式语法或短语结构语法。
下页
6, 2 其它相关语法介绍
2010-5-20 第 6章句法 (语法 )与语义理论及分析 20
6.2.2 短语结构语法
一部短语结构语法 G可以用如下的四元组来定义,
G=(T,N,S,P),其中:
T是终结符的集合,终结符是指被定义的那个语言的
词 (或符号 );
N是非终结符的集合,这些符号不能出现在最终生成
的句子中,是专门用来描述语法的。显然,T和 N的并
构成了符号集 V,而且 T和 N不相交,因此有,
V=T∨N
T∧N=Ф (Ф 表示空集 )
下页
6, 2 其它相关语法介绍
2010-5-20 第 6章句法 (语法 )与语义理论及分析 21
S是起始符,它是集合 N中的一个成员 ; P是一个产生式规
则集。每条产生式具有如下形式, a→b
其中,a∈V+,b∈V*,且 a≠b;V* 表式由 V中的符号所构成
的全部符号串 (包括空符号串 Φ) 的集合,V+表示 V*中除 Φ
以外的一切符号串的集合。
在一部短语结构语法中,基于运算就是把一个符号串
重写为另一个符号串。如果 a→b 是一条产生式,就可以通
过用 b来臵换 a,重写任何一个包含子串 a的符号串,并用
符号 " "表示对符号串所作的这种运算。所以,如果
u,v∈V+,
有,uav → ubv
G
下页
6, 2 其它相关语法介绍
2010-5-20 第 6章句法 (语法 )与语义理论及分析 22
就说 uav直接产生 ubv,或 ubv是由 uav直接推导出来的。
举例来说,如果定义了一部语法 G,其中 S是起始符,
且 N={S}
T={a,b,c}
P={S → aSC,
S→b}
于是从串 S开始,应用第一条产生式可得到串 aSc,然
后应用第二条产生式得到串 abc,S → aSC → abc
G G
或者可以重复应用第一条产生式两次,然后再用
第二条产生式,得到 S → aSc → aaScc → aabcc
G G G
下页
6, 2 其它相关语法介绍
2010-5-20 第 6章句法 (语法 )与语义理论及分析 23
如果 S1,S2,…,Sn 都是符号串,且
S1 → S2 → … → Sn
G G G
记作 *
S1 → Sn
G
就是说 S1产生 Sn,或者说 Sn是由 S1推导出来的。因此,
对于上面的简单语法有
*
S → abc
G
*
S → aaScc 等等。
下页
6, 2 其它相关语法介绍
2010-5-20 第 6章句法 (语法 )与语义理论及分析 24
通过以不同的顺序来应用这些产生式,就可以从同一
符号产生许多不同的串。由一部短语结构语法定义的语言
就是可以从起始符 S 推导出来的全部终结符串的集合。可
见,由上面这部简单语法所定义的语言是
b,abc,aabcc,aaabccc,…
一个程序如果能根据一部特定的语法来确定一个句子
的推导,就称它为一个句法分析器。
下页
6, 2 其它相关语法介绍
2010-5-20 第 6章句法 (语法 )与语义理论及分析 25
一般来说,如果把语法 G定义的语言记作 L(G),则
L(G)={W│W∈T*,且 S W}
这条定义的意思是,对于所有符号串 W,如果 W是由终结
符所组成的串,且用语法 G可以从起始符 S中推导出 W,那么
符号串 W的集合就是语法 G 所生成的语言 L(G)。
换言之,一个符号串要属于 L(G)必须满足两个条件,
(1) 该符号串只包含终结符 ;
(2) 该符号串能根据语法 G从起始符 S推导出来。
下页
6, 2 其它相关语法介绍
2010-5-20 第 6章句法 (语法 )与语义理论及分析 26
6.2.3 递归语言
理论语言学家在描述句集 (即语言 )时,经常使用这两个
慨念,递归语言和可递归枚举语言。如果我们能编一个程序,
使之以某种顺序逐个的输出 (即枚举 )一种语言的句子,我们
就说这种语言是可递归枚举的。如果能编写一个程序,它读
一个符号串后就能判断这个串是或不是某种语言的一个句子,
我们就说这种语言是递归语言。尽管这两个定义我们看起来
十分相似,但它们却是不同的。一种语言是可递归枚举的,
却不一定是递归的。假设给定某种可递归语言并且存在某种
机制来枚举这种语言的句子。
下页
6, 2 其它相关语法介绍
2010-5-20 第 6章句法 (语法 )与语义理论及分析 27
如果现在又给定一个符号串,并要求回答这个符号串是
否是这种语言的句子,那么,把每个句子拿来同这个符
号串匹配,若成功说明这个符号串是这种语言的一个句
子。但失败并不能肯定这个符号串不是这种语言的句子,
因为下一个生成的句子就可能与这一符号串匹配。这就
说明一种语言是递归枚举的,但却不一定是递归的。
短语结构语法可用来描述任何一种可递归枚举的语
言,可以建立一部语法,但却不可能靠程序判定一个输入
串是不是该语法定义的语言的一个句子。
下页
6, 2 其它相关语法介绍
2010-5-20 第 6章句法 (语法 )与语义理论及分析 28
用计算机处理语言,进行机器翻译,就是想编一个程序,
根据一部语法来确定一个输入的符号串是不是合乎语法的句
子。对于任何无约束的短语结构语法来说,要编写这样一个
程序是不可能的。
为此考虑受限短语结构语法,施加某些约束,保证生成
的语言是递归的,并且比较容易编写有效的程序来分析这些
语言,容易的程度取决于具体的约束。
下页
6, 2 其它相关语法介绍
2010-5-20 第 6章句法 (语法 )与语义理论及分析 29
与我们关系最密切的受限短语结构语法都是乔姆斯基体
系的成员。乔姆斯基 (N.Chomsky)定义了以下四类语法,
(1) 0型语法, 无约约束短语结构语法 ;
(2) 1型语法, 上下文有关语法 ;
(3) 2形语法, 上下文无关语法 ;
(4) 3型语法, 正则语法,
型号愈高所受约束就愈多,生成能力愈弱,因此能
生成的语言集也就愈小。
下页
返回
6, 2 其它相关语法介绍
2010-5-20 第 6章句法 (语法 )与语义理论及分析 30
6.3.1 机器翻译使用语法分析的过程
机器翻译的研究目的就是让计算机能够自动翻译人类的
自然语言,这样的处理过程应该包括查机器词典、进行语
法分析,参照背景知识进行语义分析等若干步骤,才能比
较好的把源语言的句子翻译为目标语言的句子。
在机器翻译的过程中,分析占有特殊重要的地位。分
析阶段人们的划分虽然并不统一,但各个机器翻译系统一
般都有形态分析、语法分析和语义分析这样三个阶段。而
且它 们 应 该是必不可少的比较重要的三个阶段。
下页
6, 3 语法分析在机器翻译中的应用
2010-5-20 第 6章句法 (语法 )与语义理论及分析 31
所谓形态分析,是指从输入的字符串序列分解出单词。
一般认为,英语的各个单词是间隔开的,形态分析比较
容易;而汉语句子中的词是连写的,词与词之间没有空
格,这就给汉语的形态分析增加了大的困难。
所谓语法分析是指已经输入的单词序列能不能构成合
法的句子,这显然要依赖于所采用的文法规则。
例如:兔子吃草
草吃兔子
这两句话符合,<句子 >←→< 名词 ><动词 ><名词 >
下页
6, 3 语法分析在机器翻译中的应用
2010-5-20 第 6章句法 (语法 )与语义理论及分析 32
当然,如果弄清那个名词应该是主语,那个名词应该是宾语
这样的语句分析就可以确定是不是正确。这应该纳入语法分
析的范畴,有的文献把这样的分析列入语义分析的范畴,这
样做语义分析的任务太繁重了。
所谓语义分析就是要弄清句子中词的含义,解决句子
中意义的不同或可不可能搭配,引进上下文信息,例如有这
么两句英语:
( 1) The fish was bought by the cook;
(2 ) The fish was bought by the river;
这两句的译文是:鱼是厨师买的,鱼是从河边买的。不
难理解,这两句的翻译与, 兔子吃草, 不同,它不是主语、
宾语颠倒,只能靠语义分析解决。
下页
6, 3 语法分析在机器翻译中的应用
2010-5-20 第 6章句法 (语法 )与语义理论及分析 33
6.3.2 模式匹配及应用
对机器翻译系统的分析部分来说,模式匹配
的本质特征就是把输入的句子作为一个整体看待
并给以相应的解释,而不去分析句子的单词或者
句子的其它更基本的成分的结构关系与语义关系。
具体的办法是在机器翻译系统中存储大量的模式
(句型就是一种模式,作为模式的句型很象学习
外语时经常使用的替换练习句型),每个模式都
对应了一个解释(或者称为目标表达式)。
下页
6, 3 语法分析在机器翻译中的应用
2010-5-20 第 6章句法 (语法 )与语义理论及分析 34
机器翻译系统将输入的句子同模式一一
进行比较,如果匹配,则转移到相应的解释
后续部分,再作进一步的处理。实例句型转
换的翻译就是采用的这一方法,那里的模式
就是双语句型结构表达式,匹配就是寻求相
同的句型。
下页
6, 3 语法分析在机器翻译中的应用
2010-5-20 第 6章句法 (语法 )与语义理论及分析 35
6.3.3 转换语法及应用
6.3.3.1 转换语法概述
由于自然语言本质上是上下文有关的,若
用上下文无关语法描述自然语言必然有很多不
合适的地方。上下文无关语法反映的只是一个
句子的生成过程。它所生成的句子不可能与另
外的句子发生关系,而在自然语言中这种关系
又是客观存在的。在这种情况下,可以采用转
换语法。
下页
6, 3 语法分析在机器翻译中的应用
2010-5-20 第 6章句法 (语法 )与语义理论及分析 36
转换语法与上下文无关语法相比,它在说明自然语言的规
律性方面要好得多;但其缺点是:用计算机实现时,效率
非常差。主要原因是经过转换,转换操作是在深层的树结
构上进行的,而不是在字符序列上进行的。
一部转换语法由一个基础部件和一个转换部件组成,
基础部件是一部上下文无关语法它产生一组深层结构的树;
转换部件是一组树的重写规则,把它们应用于一棵深层结
构树,便产生一棵或者多颗表层结构树。表层结构树的前
沿(终结节点序)就是语言的句子。转换语法的结构是很
容易被人看懂的。
下页
6, 3 语法分析在机器翻译中的应用
2010-5-20 第 6章句法 (语法 )与语义理论及分析 37
6.3.3.2 基于转换的句法分析器
转换语法可以用于句法分析,这就是句法分
析器。虽然转换语法所表达的释义关系简化了后
继阶段的处理,但是转换规则是为深层结构设计
的,若用它来处理表层结构就很复杂。归纳起来,
至少有三个基本问题:
( 1)对于一个给定的句子,它可以生成一组
句法树。这组句法树应当包括转换语法要分配给
这个句子的全部表层树;
( 2) 对于不属于基础的一棵给定的树,确
定生成这棵树可能使用的转换规则;
下页
6, 3 语法分析在机器翻译中的应用
2010-5-20 第 6章句法 (语法 )与语义理论及分析 38
( 3)可以有针对性对转换规则逐条进行判定,
如果它的结果就是当前的这棵树,就不再执行
这一条规则。
如果我们用最直接的方式来处理这些问题,
那么我们可能不得不尝试许多错误的途径。当
然,对于第一个问题可以用一部上下文无关语
法来产生转换语法可能分配给一个句子的全部
表层树,其数量可能很大,这样的语法又叫做
覆盖语法。
下页
6, 3 语法分析在机器翻译中的应用
2010-5-20 第 6章句法 (语法 )与语义理论及分析 39
例如,在英语语句中的大多数词都拥有不
止一个词类,这样就会使这种, 错误的, 表层树
的繁殖更为严重。
对于后两个问题,可以设计出一组逆向转换
规则。
综上所述,它们的处理过程由四个步骤组成:
( 1)首先,程序可以利用上下文无关的覆
盖语法,通过一个自底向上的句法分析器来一步
一步分析输入的句子;
下页
6, 3 语法分析在机器翻译中的应用
2010-5-20 第 6章句法 (语法 )与语义理论及分析 40
( 2)应用逆向转换规则;
( 3)对步骤( 1)和( 2)所产生的每一颗侯选的
基础树,检查它们是不是事实上能够由基础部件
所生成;
( 4)对每棵基础树和通过步骤( 3)的测试的转
换规则序,应用正向转换规则以证实原先的句子
确实可以生成。
下页
6, 3 语法分析在机器翻译中的应用
2010-5-20 第 6章句法 (语法 )与语义理论及分析 41
第四步中最后检查是必要的,因为覆盖语法有可能在
逆向转换过程中导致输入句子同一个转换发生虚假的匹配,
而且逆向转换不见得包括了正向转换中的全部约束。
事实上,覆盖语法产生了大量虚假的表层分析,这就
对于机器翻译系统后继的处理过程造成了很大的压力。
也可以采用两个方法来提高系统的速度:
( 1), 超树,,即用一个单独的结构来表示几棵语
法树。寄希望对这些超树应用逆向转换规则,以便能同时
处理几种可能的表层结构;
下页
6, 3 语法分析在机器翻译中的应用
2010-5-20 第 6章句法 (语法 )与语义理论及分析 42
( 2)拒绝规则:在逆向转换的过程(可见步骤
( 2))中应用这些拒绝规则来对树进行必要的测
试,以便可以在句法分析的过程中尽可能早地淘
汰某些虚假的树。在拒绝规则中收进了原先只出
现在正向转换部件中的某些约束,从而可以删除
步骤( 2)中的某些树,这样,就可以不让它们继
续存在到步骤( 4)了。
下页
6, 3 语法分析在机器翻译中的应用
返回
2010-5-20 第 6章句法 (语法 )与语义理论及分析 43
6.4.1 汉语语法概述
汉语语法的特点可以归纳为以下七个方面:
( 1)句子之中缺少形态标志,即每个词缺少外
部形态标志,所以组词或者组句不靠形态变化,
而是靠语序和虚词。
首先我们来看汉语语法的语序问题,汉语
如果跟拉丁语相比,拉丁语中, 老王打小李,
这样一句话可以任意安排顺序;但在汉语中,
如果把, 老王打小李, 变成, 小李打老王, 意
思就相反了,因此可见汉语语序的重要性 。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 44
其次,汉语的虚词很丰富,在不影响语义的前提
下,用不用虚词带有很大的灵活性,这是西方语言
所没有的。
在印欧语这样的语系里,其主语、宾语一般都
由名词来充当,谓语一般则由动词充当,定语大多
数由形容词充当; 在汉语中,大家知道,名词并不
总是都用作主语和宾语,也可以作定语甚至谓语。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 45
例如,春节到了。(主语)
我在中国过春节 。(宾语)
春节晚会开得好。 (定语)
明天春节了。(谓语)
在汉语中,它们的语句中被人们认为是动词的并不
总是作谓语,也可以作做主语、宾语或者定语。例如:
我们回去 。(谓语)
回去行,不 回去也行。(主语)
回去的日子不远了。(定语)
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 46
( 2)汉语的构词法和造句法的结构规则基本相同。
语素构成词,词构成短语和句子,都用一套共同的
规则。
( 3)汉语具有主题化的倾向。汉语习惯上把最重
要的一个词或者短语放在句首做主语,其余部分作
谓语(包括其它部分)。
( 4)汉语动词没有西方语言那种时态变化,汉语
的时主要靠时间词、副词和上下文来进行表示。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 47
例如:
昨天他写了一篇论文。(过去完成时)
你看,他借了一支笔。(现在完成时)
等我上完课再去看电影。(将来完成时)
( 5)一般情况下,只要认为不会影响汉语的某个句子的语
义表达,这个汉语句子的主语就可以被省略。
( 6)有丰富的量词也是现代汉语的一个特点,并且不同的
名词要和不同的量词搭配。例如:一本书、一张纸、一匹
马等等。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 48
( 7)在汉语中,词的搭配有一定规则。
例如:, 加以,
一般说:加以考虑(对),加以想(错)
,进行,
一般说:进行学习(对,进行学(错)
,颇为,
一般说:颇为优越(对),颇为好(错)
,极为,
一般说:极为丰富(对) (,极为多(错)
,伟大,
一般说:伟大祖国(对),伟大国(错)
,严重,
一般说:严重灾害 (对),严重灾(错 )
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 49
6.4.2 汉语语法单位和句子成分
汉语的语法单位也是由语素、词、短语、句子等四级
构成。
词可分为单纯词和合成词两种。
汉语合成词有如下三个特点:
( 1)意义的组合。例如, 奶粉, 不说成, 牛奶粉, ;
,豆腐, 不说成, 黄豆腐, 。
( 2)词的内部结构一般由两个直接成分组成。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 50
( 3)有很强的双音化倾向,经常把单音词凑成
双音词。例如, 老虎,老鼠, 等等,这里的, 老,
纯粹是音节所必须的。
汉语的词又可以分成实词和虚词两大类。实
词和虚词的区别主要在于前者是内容词,而后者
是功能词。
短语由词构词,是意义上和语法上能搭配的
一组词。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 51
根据词和短语在句子里的组合位臵和语义的
特定关系,可以把汉语句子成分分为八种, 即主
语、谓语、述语、宾语、补语、定语、状语和中
心语。这八种成分既体现了结构关系,又体现了
语义关系。
这些关系中,主语是和谓语相对的直接成分,
述语是和宾语或者补语相对的直接成分,状语是
和谓语性中心语相对的直接成分。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 52
主语和谓语的关系:先要传递的信息放前面,
这就是主语;后面是对前面的说明,就是谓
语。主语代表已知信息,谓语说明信息。从
语义关系看,主语和谓语的关系可以看成动
作者和动作的关系。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 53
述语与宾语、补语从语义关系考虑,述语
表示动作或者状态,宾语和补语则表示动
作或者状态涉及的事物、时间和数量等。
定语和状语都是修饰语。一般情况下,
名词性中心语前面的修饰语是定语,谓语
性中心语前面的修饰语是状语。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 54
在汉语中,定语和状语一定放在中心语前;
特殊情况下,汉语的状语跟中心语相互交
换位臵。定语在于限制或者描述中心语。
状语所表示的意义非常广泛,包括方向、
时间、频度、情态和方式等。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 55
6.4.3 汉语句子分析方法
有两种比较流行的分析方法:
( 1)句子成分分析方法
句子成分分析方法的主要点是把构成句子的成分分成
六种:主语、谓语、宾语、补语、定语和状语。分析句子
实际上就是说明句子成分的搭配情况。但是大量的事实表
明,有些复杂的句子结构不是用这种简单的方法能够划分
清楚的。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 56
句子成分分析方法的最大缺点是不重视语言结构
的层次。例如,句子成分分析方法无法区分以下
两个句子:
这位工人的建议很好。
这项工人的建议很好。
句子成分分析方法对这两个句子的分析结果都是:
定语 — 定语 — 主语 — 状语 — 谓语
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 57
( 2)层次分析方法
层次分析方法认为,任何语法结构都是有层次的,
每个层次通常由两个直接成分组成,语法分析必须逐层
进行,原则上都可以把各层的语言单位分为两个(或者
多个)直接成分,一直分到不可以再分为止。
这种分析方法能够简单而清楚地把句子结构显示出
来。这样一种优点在分析多义的短语和句子时表现得最
明显。例如,两个 国家的企业
两个国家 的企业
显然,前句指一个国家的两个企业;后句指两个国
家的企业。层次分析方法仍然有必要吸取句子成分分析
方法的优点,因为层次分析方法没有把直接成分之间的
结构关系显示出来。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 58
例如:, 烤羊肉, 可以是一种食品,也可以说明在烤这
个羊肉,但是它的层次结构并不能区分这两种关系。
如果采用句子成分分析方法,就能显示出这样的关系:
烤 /羊肉(名词短语)
烤 /羊肉(动宾结构)
汉语还有一个现象值得注意,即某些词不与一个词搭配,
必须跟一个短语搭配。作为一个简单的例子可以看到,
副词, 很, 一般都不能修饰那些单个的动词,但是它却
能够修饰宾式动词短语。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 59
如:很有兴趣
很解决问题
可以再作进一步的考察看到,副词往往是
不能够修饰述语的,但是它却能够修饰整个述
补短语。
如:不吃得过饱
都长得美清目秀
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 60
6.4.4 英语语法概述
这里的英语语法是以生成语法为理论基础
的,主要研究句子结构和句子的各成分在构成
一个句子时所起的作用,以及它们之间的相互
影响。这样的英语语法是面向机器翻译系统的
语法。它以句子结构为主线,侧重考虑如何构
造一个合格的英语句子,以及每个句子成分之
间的相互关系,还包括它们在句子中所起的作
用。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 61
在英语中,词构成短语,短语构成句子。词是构成句子
的基本单位,根据形式、意义及其在句子中的功能,英
语划分为十大词类:
( 1)名词 如,book,worker
( 2)代词 如,he,you
( 3)形容词 如,capable,related
( 4)数词 如,one,twenty
( 5)动词 如,derive,get
( 6)副词 如,presently,currently
( 7)冠词 如,a,the ( 8)介词 如,in,from
( 9)连词 如,and,or ( 10)感叹词 如,oh,alas
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 62
比较多的情况下,英语中的词先构成断语。短语是意
义上的一个单位,其种类很多,英语中常用的基本短语有
以下几种:
( 1)动词短语
( 2)形容词短语
( 3)名词短语
( 4)位臵短语
( 5)倾向短语 表示运动的方向或者运动的趋势。
有些英语句子由一个或者一个以上的从句构成。从句
是由关联词引导,内部含有主语、谓语,意义上像句子,
但语法上不能成为独立句子的一组短语。从句主要包括主
语从句、表语从句、宾语从句、定语从句和状语从句。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 63
通过分析不难了解,不同的短语在句子中的功能不同,
构成了不同的句子成分。英语的句子成分主要有以下六种:
( 1)主语 是句子所要说明的事物,是一个句子的主体;
( 2)谓语 是说明主语的动作和状态的;
( 3)表语 是放在系动词之后表示主语的身份或者特征的;
( 4)宾语 一般是表示及物动词动作的对象的,但是在英
语中介词后面的名词或者名词短语叫介词宾语;
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 64
( 5)定语 是限定或者修饰名词用的;
( 6)状语 是修饰动词、形容词、副词或者全句用的。
通常情况下,英语中的主语由名词短语或者从句构成,谓语
由动词短语构成,而补语由名词短语或者形容词短语或者从
句构成,而修饰成分一般由形容词短语、副词短语、位臵短
语、倾向短语或者从句构成。 句子由主语和谓语构成,有
比较完整的意义。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 65
6.4.5 英语中词的作用
6.4.5.1 英语动词
动词是一个英语句子的核心部分。
英语动词可以分为五类:
( 1)及物动词; ( 2)不及物动词;
( 3)系动词; ( 4)助动词; ( 5)情态动词。
在英语中,许多情况下一个动词一般可以用作不同类
的动词。有些动词和一些别的词构成固定的短语,表达了
一个概念,作用和一个单独的动词差不多,这就是短语动
词。动词与它的补语搭配构成动词短语。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 66
英语动词充当谓语时,其形式要受到主语的限
制,即为动词的限度形式,主语对动词的限制
表现在人称、数、时态、语态和语气上。动词
还有一种不受主语限制的形式,即动词的非限
定形式。这种形式不能独立作谓语,但是可以
和助动词或者情态动词等构成谓语,还可以在
句子中充当主语、宾语、状语、定语和表语等。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 67
英语动词一共有十六种时态,其中最常用的有四
种,即:
一般现在时;现在进行时;现在完成时; 一般
过去时;
当谓语表示一个动作时,主语和它可以有两种不
同关系,即主动关系和被动关系。在表示主动关
系时,谓语的形式称为主动语态;在表示被动关
系时,谓语要用被动语态。在被动结构的句子中,
动作执行者可以由介词 by 引起的短语表示。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 68
英语动词有三种非限定形式,即:
( 1)动名词 英语中的动名词主要是起名词的作用,一般
都可以被用作主语和补语,这里表示为动词 +ing。
( 2)分词 英语中的分词许多场合下主要起形容词的作用,
一般都可以被用作补语和修饰成分。英语的分词有两种,它
们是过去分词和现在分词。现在分词和动名词的形式是完全
相同的,过去分词表示为动词 +ed 。
( 3)不定式 不定式能够起名词的作用,也能够起形容词
的作用,可以作主语、补语和修饰语,表示为 to + 动词。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 69
6.4.5.2 英语中心词和它们的补语
英语中的短语在构成更大的短语或者构成一个
句子时,它的功能由短语中一个被称为中心词的单
词决定,中心词的词性和形态决定了整个短语在句
子中的功能。短语的中心词不同,它在句子中发挥
的作用也不同。不同词性的中心词构成不同类型的
短语。
在英语句子之中,通常一个短语是由中心词和
中心词的补语构成的,补语对中心词起补充和说明
的作用。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 70
补语在构成短语的过程中起到了重要的作用,补语
与作为中心语的单词会相互影响,可以反映短语的
中心语的某些性质。中心语的词性不同,它所要求
的补语也不同。补语的选择与不同的单词有很大的
关系。
补语有下列三种:
( 1)动词的补语; (2)形容词的补语; (3)名词
的补语。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 71
6.4.5.3 英语名词短语
在大多数英语句子中,它们的主语和动词的补语是由名
词短语构成的。名词短语构成形式多种多样,有 the + 普
通名词构成 NP,代词和专有名词也可以构成 NP,名词短
语的所属格 + 普通名词短语也是 NP等等。
一般情况下,名词短语有以下五类:
( 1)代词和专有名词短语;
( 2)普通名词短语;
( 3)由限定词、名词属格、不定冠词引出的名词短语;
( 4)由量词引出的名词短语;
( 5)由量词加一个 of 短语。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 72
6.4.6 英语从句
在英语中,英语从句是由关联词 + 主语 + 谓语构
成的,英语从句去掉关联词以后,非常像一个句子。但是
从句在语法功能方面不能独立成立,所以叫做从句。从句
可以分为名词性从句和修饰性从句两大类:
6.4.6.1 名词性从句
名词性从句在复合句中的功能与 NP相同,作主句的主
语、动词的补语和介词的宾语。典型的名词性从句还可以
有以下几类:
( 1) That 语句;
( 2)非限定性从句;
( 3)间接疑问句。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 73
6.4.6.2 修饰性从句
修饰性从句又可以分为两种:
( 1)修饰 NP的定语从句;
英语的 定语从句所修饰的词被叫做先行词,定语
从句必须要放在先行词之后。引导 定语 从句的这些关
联词有 who,whom,whose,which,when,
where,that等等。当然,在英语中也有些定语从句
没有关联词引导。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 74
定语从句的结构有以下三种形式:
[1]一个由关联词引导的短语 + 缺少一个与关联
词引出的短语具有相同词性的短语的句子这样的
结构形式;
[2]that + 一个缺少 NP的句子;
[3]一个缺少 NP的句子。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 75
如果定语从句是由关联词 that引导,或者
根本没有关联词,那么这个从句所缺少的部分
即为它所修饰的先行词。
如果定语从句是由其他关联词引导,则先行
词可以代表关联词,而关联词引导的短语相当
于从句所缺少的部分。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 76
( 2)修饰 VP,AP等的状语从句
状语从句在句子中作状语,可以修饰主句
中的 VP,AdjP,AdvP等。状语从句由从属连词
引导,状语从句的位臵可以放在句子首部或者句
子末尾。放在句子首部时,从句后面常常用一个
逗号;放在句子末尾时,从句前面不用逗号。
状语从句可以分为时间、地点、原因、目
的、结果、方式等等。
下页
6,4 汉语和英语语法的概述
返回
2010-5-20 第 6章句法 (语法 )与语义理论及分析 77
6.5.1 语义分析概述
自然语言语义分析和机器翻译语义分析技术是比较重
要的一环。什么是语义分析呢?就是在语法分析之后,通
常要进行句子意义上正确与否的检查 —— 语义分析。对同
一个自然语言的输入,语法分析的结果往往会得到若干不
同的分析树。
例如:指导研究生的工作是重要的
这句话,可以有以下三种结构:
( l)指导 研究生的工作 是重要的
( 2) 指导 研究生 的工作 是重要的
(3) 指导研究生 的工作 是重要的
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 78
但从语义的角度看,这句话的意思只能是( l)
或者是( 2)而不会是( 3)。因为在汉语中不存在
,指导研究生, 这个名词短语。如果把这句话中的
,研究生, 换成,‘ 教师,,语法分析的结果不
变,但是其意思大概是 (3),而不是 (l)和 (2)。
还有,如果说:培养教师的工作是重要的
则只有第 (2)种结构才是适当的 ;
培养 教师 的工作 是重要的
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 79
因此,语义分析是必要的。语义分析就是要识别一句话所
表达的实际含义,说很明确些,那就是要弄清楚, '
干什么了,,, 谁干的,,, 这个行为的原因或结果是什
么,,以及, 这个行为发生的时间地点以及所使用的工
具, 等等。为了弄清楚这些关系,必须要有关于客观真
实性界的知识。
例如:, 吃, 这个动词通常指的是动物的行为,这
个行为的主体应该是动物,这个行为的对象是, 可以吃
的东西, 。系统中有了这些知识,就可以进行语义分析。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 80
语义分析还有一个重要内容,就是要能够进行推理,
即从巳知的事实和规则推断出合理的结论。
例如,从, 鸟会飞, 这一大前提和, 燕子是鸟, 这
一小前提,根据三段论法的推理规则能够得到, 燕子会
飞, 的结论。
把理解了的内容用什么方式表现出来随着系统应用
目的的不同而有所变化。例如,在情报检索问答系统中,
可以用检索式 ; 在机器翻译系统中,可以表现为代词
指代的确定,省略语句的恢复、意译信息的获取 ; 在
文章理解系统中,可以表现为关键信息的抽取、登场人
物关系的确定等等。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 81
尽管应用形式多种多样,但是有关语义和知
识的形式表达及推理机制却有一定的普遍性。这
方面的研究也是人工智能领域的中心课题。
虽然语法分析和语义分析是不同层次的工作,
但在实际系统中并非都是截然分开的。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 82
6.5.2 语义分析方法
6.5.2.1 语义语法方法
语义语法的表示方法与上下文无关语法相似,
但是语义语法不使用, 名词短语,,, 名词,,
,动词, 等这样的不含有语义信息的纯语法成分,
而代之以象, 人类,,, 动物,,, 植物, 这样
的有很强的语义约束的范畴。这样就可以排除诸
如, 白菜吃兔子, 之类无意义的句子。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 83
为了说明语义音符是怎样使用的,可以考察下面一些
重写规则:重写规则的形式与上下文无关语法一样,
没有什么需要了解的。其内容也是上下文无关语法。
这个语法只使用几条规则,也可以识别一些输入。
语义语法不仅可以排除无意义的句子,而且分
析的效率也很高。但是,语义语法只能适用于严格限
制的领域。当要把这种分析技术从一个应用领域移植
到另一个应用领域时,改写语法的工作量很大,甚至
要完全重写。因此这种语法只有实用价值,而不适
合作语言学研究的一般模型。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 84
6.5.2.2 格语法方法
格的概念是当要理解一句话的意义时,首先明确判
定一句话当中在语义上居支配地位的成分是有用的。例如,
Mickey talked to him
这句话中,Mickey是名词,作主语,talked是动词,作谓
语。可能会以为,既然名词作了, 主语,,那一定是名词
起主要作用了。我们知道,在英语国家 Mickey既可以是人
的名字,也可以是猫狗的名字。如果就这句话问,Mickey
是人的名字还是动物的名字。恐怕回答是人的名字者居大
多数,这是因为 talked(说话了 )是人的行为。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 85
同样,如果针对 Mickey barked at him
这句话提同样的问题,则回答 Mickey是狗的名字者应该居
大多数,这是因为 barked(吠叫了 )通常是指狗的动作。
由此可见,不是主语支配动词,而是动词的意义起支配全句
的作用。当着眼于语义分析一个句子时,按照格语法的观点,
首先要确定这句话中的中心动词是什么,然后再确定其它成
分与这个动词的关系。如有的是执行这个动词的动作的主体
(施事),有的是动作所作用的对象 (受事 ),有的是执行这
个动作的工具以及其它种种关系。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 86
例如,He opened the door with the key.
在这句话中,open是中心动词,He是施事,door是受事,
key则是工具。
格语法的提出者把这些反映语义的关系分别叫做动作
主格、受动者格(或对象格、工具格等等。这些格的概念
固然起源于语法学中的主格、宾格、所有格等这样的用语,
但格语法的格概念与传统语法的格慨念有本质的不同。传
统语法书的格反映的只是词尾的变化规则,是表层的格。
格语法的格反映的是语义关系,认为这种语义关系在人说
话之前就存在于人的头脑之中。因此是深层的格。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 87
再看以下两句话:
The key opened the door
The door opened.
从格语法的观点看,尽管 key可能作一句话的表层的
主格,对于动词 open,它总是深层的工具格,无论 door
作句子的表层的宾格还是主格,它总是动词 open的受动
者格。
应用格语法时,首先碰到的一个问题就是,为了反
映客观存在的语义关系,应该规定多少格以及这些格的
明确含义。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 88
Fillmore提出了以下八种格,
(1) Agent 动作主格
(2) Counter-Agent 反动作主格
(3) Object 受动者格
(4) Result 结果格
(5) Instrument 工具格
(6) Source 来源格
(7) Goal 目标格
(8) Experience 经验者格
不同的语言学家对此有不同的看法和建议,甚至关
于选择格的标准的看法都相距甚远。在众多的实验系统
或实际系统中,有的选用四、五个格,有的使用的格
的数目超过 30个。看来,得根据对象语言和应用领域进行
仔细的分析,作出切合实际的抉择。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 89
在格语法中,可以规定一共使用多少种格。但对每一个具
体的动词,并非都要具备所有的格。对于一个动词,如果某
个格是必须要有的,没有它就不能构成完整的句子,则这样的
格叫做必备格。
例如,动词 break(打碎 )就必须要有受动者格。
在下面的两个句子中:
In the room,he broke a window with a hammer.
The window broke.
window 是 break的受动者格。特别要注意到,第二个句子很短,
提供的信息很少,但它是一个完整的句子。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 90
The window尽管是语法上的主语,但它仍是
break的受动者格。由此可以看出,受动者格是
break的必备格。第一句中的其他格,象动作主
格 he,地点格 room,工具格 hammer都是选
用格。所谓选用格,指的是这样一种格,句子
中有了它,可以提供更多的信息,没有它也不
会破坏句子的完整性。某个动词不能有的格叫做
禁用格,例如目标格或方向格就是 break的禁
用格。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 91
格框架可以应用于上下文无关语法分析一个句子,
得到一棵语法树。这种语法树是依赖于词序的。应用格
语法分析一个句子时,得到的将是一个格框架,这种
格框架是不依赖于词序的,它不仅依赖于语法信息,而
且更多地依赖于语义信息。
一个格框架由一个主要概念和一组辅助概念组成,
这些辅助概念以一种适当定义的方式同主要概念相联系。
狭义地可以把主要概念理解为中心动词,可以把一组辅
助概念理解为动作主格、受动者格、地点格等各种语义
的深层的格。
对应于例句 In the room,he broke a window with
a hammer for Billy 的格框架可用一种简化了的一
般形式表述如下,
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 92
[BREAK
[case-fram
agent, HE
object, W!NDOW
instrument,HAMMER
reciplent,
directive,
locative, ROOM
benefactive, BILLY
co-agent,]
[modals
time, past
voice, active] ]
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 93
这种记述形式也是表( (list),其中主要概念是动词
BREAK,象 agent等各种格用小写字母表示,而句子中的词
作为格的填充物用大写字母表示。请注意,这里虽然也采
用了 8种格,但是这 8种格的名称和含义同 Fillmore建议的
并不完全相同。此外在框架中还包括 time,voice等情态
信息。
为了得到这样的格框架所记载的信息,必须要在系
统中准备一部组织得很好的辞典。对于动词,要规定每个
动词的必备格是哪些格,禁用格是哪些格。还要规定具有
什么样的语义的名词可以填入那些必备格和选用格。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 94
对于名词则要附加体系化的语义信息。这样,在应用格
语法分析自然晤言的句子时,不仅需要语法知识,而且
需要语义知识。
试比较以下两句话:
Johe broke the window with a hammar
John broke the window with Mary
从语法上看,它们是完全一样的。介词短语 with a
hammar 和 with Mary 都是修饰动词 broke的。但是上
一句的 hommar应填入工具格,下一句的 Mary则不能填入
工具格。在通常的情况下,John不会把 Mary当作砸窗子
的工具使,Mary应填入 co-agent格。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 95
可以想象,辞典中规定了 break的工具格应填入工具一类
的名词,对名词 hammar则应指明它是工具,而对名词 Mary
则通常指明它是人 (特别是女人 )的名字,当然也就不是
工具。
应用格框架的分析步骤可以分析上述介绍的格框架。
用于分析的格框架(即动词辞典中每个特定动词所有的
空架子 )的格式略有所不同,它应对于每个格,指明语义
信息和语法信息。
例如,Copy the FORTRAN files from the
system library to my directory
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 96
应用格框架,分析上面这个句子的具体步骤是:
( l)对子系统辞典中的每一个格框架,在输入序列的任
何位臵查找,有无与其相匹配的串,如果没有,则输入是不
能按照此格语法进行分析的。如果找到下一个或多个,
则对每一个执行以下分析,那些同整个输入串匹配的格框
架可能成为分析的结果。
( 2)根据识别的结果,按索引检索所需要的格框架。
( 3)识别必备格
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 97
[l]如果格带有位臵标志,则从指定位臵查找格
的填充物。
[2]如果格带有语法标志,则在整个输入序列中
查找有无该标志 (这是很简单的一、两个词的匹
配),如果找到了,则以该标志为起点,向右 (或
向左 )查找格的填充物。
[3]在查找格的填充物时,很有可能要用到更加
复杂的分析策略,例如,还有可能要识别嵌套的
格框架。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 98
( 4)按照同样的办法识别选用格。
( 5) 如果必备格和选用格都被处理了而输入序列中
还有未被识别的部分,这里就有了错误。或者是输入
到一个反映句子语义的实际的格框架。
从上面的分析可知这种方法把自底向上的过程与自顶
向下的过程 (寻找格槽的填充物 )有机地结合起来,大大
提高了分析的效率 ; 格语法可以递归地处理关系从句
和其它的语言结构;格语法综合运用语法 (位臵标志与
语法标志 )和语义的知识,从而减少了结构与词义的歧
义。这些优点使得格语法成为自然语言分析的有力手
段,至令仍在积极研究中。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 99
6.6.2.3 概念依存理论方法
先看两个具体的英语句子,
John gave Mary a balL
Mary took a ball from John.
如果用格语法分析它们,将会得到两个不同的格框架,
前者是动词 give的,后者是动词 take的。
动词 give的 agent是 John 动词 took的 agent是 Mary。
尽管这两句话的表现重点不一样,但是它们表达的事实却
是一样的。
在概念依存理论中,只使用一个原语概念 ATRANS表达
这两个动词动作(甚至更加广泛的意义)的语义。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 100
这两句英语表达式是:
[ ATRANS
rel, POSSESION
actor, JOHN
object, BALL
source, HOHN
recipient, MARY ]
" John gave mary a ball "
[ ATRANS
rel, POSSESION
actor, MARY
object, BALL
source, HOHN
recipient, MARY ]
" Mary took a ball from John "
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 101
对照一下这两个结构,容易看出,所发生的
两个事件在哪些方面是相同的,在哪些方面是
不同的。当在英语句子中分析至 give或 toke或
其它有相近意义的动词时,就调用 ATRANS(这是
Abstract TRANSFER 的缩写记号 )的框架以及
在此框架上建立的推理规则。
在概念依存理论中使用的格与格语法中的格
是相似的,但不完全相同。这一理论中一个稍细
的地方是把 agent区分为 actor和 source。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 102
6.5.3 语义分析小结
以上介绍的各种语义分析的技术虽然
为理解、处理自然语言以及机器翻译提供
了工具,类似的工具还有很多,但是它们
的成功都还是局限在某个方面或一定的范
围。自然语言的现象十分复杂,还有大量
的问题有待研究。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 103
人能够听得懂、看得惯病句的意思,计算机
怎样去理解有毛病的句子呢? 从键盘键入的
句子很难保证一个字母也不错漏吧? 如果让
计算机弄明白句中的参照关系,如,Tom
asked his father if he would buy
him a balL
这一句中的 his,he,him指的是 Tom还是 Tom
的父亲,人是能明白的,计算机如何能理解
其中的关系。一句话尚且如此,一篇文章、一
个剧本中的参照关系就更复杂了。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 104
人们说话、写文章时,常常省略掉一些成分和意思,
计算机到哪里去找回这些省略了的信息呢?
人们常常使用隐喻,计算机恐怕更难理解了吧?
同样一句话,不同社会地位、不同职业的人讲出来,
其意义和作用就很不一样。因此,孤立地研究语言本身
并不能最终地解决问题。
可以列举的问题还有很多。以上这些问题的解决一方
面需要多个学科的专家的联合攻关,一方面也要依靠具
备多学科知识的人起桥梁作用。有志于从事机器翻译研
究的专业人员应多方面地吸收新的知识,以丰富自己的想
象力和创造力。
6, 5 语义分析
返回返回首页
6.1 句法分析与用作翻译的理论基础
6.2 其它相关语法介绍
6.3 语法分析在机器翻译中的应用
6.4 汉语和英语语法的概述
6.5 语义分析
第 6 章 句法(语法)与语义理论及分析
下页
2010-5-20 第 6章句法 (语法 )与语义理论及分析 2
6.1 句法分析与用作翻译的理论基础
下页
(1)确定输入句子的结构句法分析要识别构成句子的各
个成分以及它们之间的相互关系,例如确定每个动词的
主语和宾语,以及每个修饰性的词或短语所修饰的成分,
通常这是通过给每个输入句子构造一则句法来完成的。
(2)句法结构的规范化,如果我们把大量的输入结构映射
为数量较少的结构,那么后继处理 (例如语义分析 )就得
以简化。
6.1.1句法分析的任务
句法分析有两个 主要 任务,
2010-5-20 第 6章句法 (语法 )与语义理论及分析 3
1>句子中常有些成分可以被省略 ; 所
谓句子结构的规范化就是把这些省略的
信息补上。
2>各种转换可以把结构不同的句子变得
相同,例如主动语气和被动语气。 这样
一类转换使后继处理只考虑数量少得多
的结构 。
下页
6.1 句法分析与用作翻译的理论基础
2010-5-20 第 6章句法 (语法 )与语义理论及分析 4
结构规范化是否应由句法分析模块来完成一直有争议,
理论语言学倾向于限制句法分析模块完成这一任务,认为
这是词法分析过程不应由句法分析来处理,某些计算语言
学家则完全放弃了句法结构的规范化,而让语义分析模块
直解去处理各式各样的句子结构。在这一类系统中,句法
结构的规范化实际上被包含在语义分析过程中了。但是这
样做确实要求更复杂的语义规则,因此在自然语言处理系
统中一般的做法仍然包含这样一种结构规范化的模块。
下页
6.1 句法分析与用作翻译的理论基础
2010-5-20 第 6章句法 (语法 )与语义理论及分析 5
在一个机器翻译理解系统中,句法分析要不要作为一个独
立的分析阶段存在?这个问题同样有争议,因为在现有的
系统中,不外乎有以下两种处理方法,
(1)先句法后语法,强调在语言分析过程中存在一个相对独
立的句法分析阶段,结果是句子的一棵句法结构树。在经
过语义分析模块的处理,获得该句子的某种意义表示,当
然在句法分析中偶尔也需要利用附加在词和短语上的某些
必要的语义信息,但它主要依据是句法范畴 (即词类和短语
标记等 )那样的形式特征。实践证明,这类句法分析的设
计可以不依赖某个特定的应用领域,因而具有好的可扩展
性和可移植性。这是当前大多数系统采用的分析策略。
下页
6.1 句法分析与用作翻译的理论基础
6.1.2句法分析是否必要
2010-5-20 第 6章句法 (语法 )与语义理论及分析 6
(2)句法 -语义一体化 (或并行 ):这种分析方法不再单独设
臵一个句法分析模块,也不出现句法结构树这样一种中间
的分析结果。在这类系统中,句子分析所依据的形式特征
与其说是句法范畴,还不如说是语义范畴。一体化分析策
略的主要论据是心理学方面的合理性,即面对那些有语法
错误或信息不全的句子,人们往往可以根据语义线索来获
得句子的解释,对于比较复杂的句子,没有句法指导,语
义分析往往难以奏效。而且对于忽视句法分析的观点持批
评态度的人也可以举出另外一些例子说明重视句法也同样
具有心理学根据,比如人们时常在不知道一个词的意义时
仅仅根据句法规则来判明这个词在句子中的功能。
下页
6.1 句法分析与用作翻译的理论基础
2010-5-20 第 6章句法 (语法 )与语义理论及分析 7
6.1.3上下文无关语法
在一部上下文无关语法中,每条规则都采用如下形式,A→x
其中,A∈N,x∈V*,即每条产生式的左则必须是一个单独
的非终结符。在这种形式体系中,规则被应用时不依赖于符
号 A所处的上下文,因此称为上下文无关语法。
下例,S→aSc S→b 是上下文无关语法。
只要改变一下规则中的符号,令
S→(S) S→x 便可生成成对括号表达式,x,(x),
((x)),(((x))),((((x))),…
下页
6.1 句法分析与用作翻译的理论基础
2010-5-20 第 6章句法 (语法 )与语义理论及分析 8
上下文无关语法正是以这种方式解决了正则
语法不可能解决的嵌套结构。
上下文无关语法广泛应用于程序设计语言和自
然语言描写中。在专业文献中,时常看到用 (BNF)
表达上下文无关语法,它同表示短语结构语法的标
记略有不同。在 BNF中,用尖括号标明非终结符,
可以用符号 "::="代替 "→" 。此外,如果有两条或
更多的产生式具有相同的左侧,它们可以作为一条
单独的 BNF定义被聚集在一起,并用符号 "│" 分隔。
下页
6.1 句法分析与用作翻译的理论基础
2010-5-20 第 6章句法 (语法 )与语义理论及分析 9
因此上例生成成对括号表达式的产生式规则,可
表示为,
<S>::=(<S>)│x
除了表达上下文无关语法以外,还时常需要
表达句子的推导。推导显示一个特定句子怎样根
据语法规则生成。可以把推到表示为产生式应用
的一个程序。
下页
6.1 句法分析与用作翻译的理论基础
2010-5-20 第 6章句法 (语法 )与语义理论及分析 10
举例,如果有语法
<SENTENCE>,:=<SUBJECT><VERBPHRASE> (1)
<SUBJECT>,:=Jone│Mary (2)
<VERBPHRASE>::=<VERB><O (3)
<VER>,:=eats│drinks (4)
<OBJECT>,:=wine│chee (5)
可以把句子 "Mary eats cheese"的推导表示如下,
<SENTENCE>→<SUBJECT><VERBPHRASE>
→Mary<VERBPHRASE>
→Mary<VERB><OBJECT>
→Mary eats <OBJECT>
→Mary eats cheese
6.1 句法分析与用作翻译的理论基础
下页
2010-5-20 第 6章句法 (语法 )与语义理论及分析 11
以上下文无关文法为基础的,一个串到串的
映射称为句法引导的翻译。 形式上,从字母表 ∩
上的语言 L1到字母表△上的语言 L2的翻译是一个
在 L1× L2中的关系 T。 对于在 T中的翻译对 (x,y),
即说输入串 x被翻译成输出串 y。 [注意 ]一个给定
的输入可能会有任意数量的,互不相同的输出翻译。
5.1.4 句法引导的翻译理论模型
6.1 句法分析与用作翻译的理论基础
下页
2010-5-20 第 6章句法 (语法 )与语义理论及分析 12
如果把 "翻译单元 "赋给上下文无关文法的每个产
生式,就可以得到翻译系统的形式模型,这个系统
可产生句法引导的翻译。在一般的上下文无关文
法中,一个产生式是形式为 A→a 的项,它表示导
出 ∩ +中的句子时,非终极符 A可以用 a来代替。为
实现句法引导的翻译,有必要考虑两个同时出现
的导出。第一个导出得到 ∩ + 中的输入串 x,第二
个导出得到 x的翻译,也就是在△ +中的输出串 y。
6.1 句法分析与用作翻译的理论基础
下页
2010-5-20 第 6章句法 (语法 )与语义理论及分析 13
为产生第二个导出,把形式为 A→a 的输入产生式和形
式为 A→β 的输出产生式合并,就得到 A→α,β 的重写规
则。 A→α,β 表示,在输入串的导出中,非终极符 A可
以用 α 代替,同时,在输出的导出中,可以用 β 代替 A,
即,对重写规则 A→α,β 来说,β 是 α 的翻译单元。
上述性质的理论模型为句法引导的翻译系统, 简写 SDTS,
且为一个五元组 J=(N,∩,△,R,S),其中,N为非终
极符的有限集 ; ∩ 是有穷的输入字母表 ; △ 是有穷的输
出字母表 ; R是规则的有穷集 ; S是在 N中,是起始符。
R的元素形式 A→α,β 。 在每个规则中,α 中的某
个非终极符在 β 中必须有一个对应的替换串。在 α 中的每
一个非终极符,在 β 中都有一个与之联系的,相对应的非
终极符。
6.1 句法分析与用作翻译的理论基础
下页
2010-5-20 第 6章句法 (语法 )与语义理论及分析 14
STDS的输入文法是 Gi=(N,∩,Pi,S),具有产生式
Pi={A→α│A→α,β 在 R中 }
输出文法是 Go=(N,△,Po,S),具有产生式
Po={A→β│A→α,β 在 R中 }
SDTS的思路是,用 Gi求在 ∩ 上的导出,同时通过规则,用
Go求在△上的导出。仅当 (x,y)是一个翻译时,在 L(Gi)
中的输入串 x才能被翻译成在 L(Go) 中的输出串 y。因为
在 L(Gi)中的每个句子,在 L(Go)中至少有一个对应的串。
6.1 句法分析与用作翻译的理论基础
下页
2010-5-20 第 6章句法 (语法 )与语义理论及分析 15
翻译集合 J的定义,
τ(J)={(x,y)│x 在 L(Gi)中,y在 L(Go)中,
(x,y)是一个翻译形式 }
这个翻译集合 τ(J) 是 L(Gi)× L(Go)中的一个关
系。 通常,对于一个给定的 x,可以有不止一个 y
使得 (x,y)是在 τ(J) 中,因此翻译过程是不确
定的。
在句法引导的翻译中,把输入句子翻译成输出句
子时,有两种情况会引起歧义性,
6.1 句法分析与用作翻译的理论基础
下页
2010-5-20 第 6章句法 (语法 )与语义理论及分析 16
第一种:是上下文无关文法中的歧义性概念的直接推广。
在 τ(J) 中,如果至少存在一个翻译形式 (x,y),使得
在使用输入文法时存在两个或更多个各不相同的 x最左导
出,而它们产生出相同的输出串 y,那么,这个 STDS是歧义
的。这时虽然产生相同的翻译,但为产生这个翻译,所用的
基本句法可能是不同的 ;
第二种:输入串 x产生多个输出串。即,如果在 L(Gi)中
至少存在一个输入串 x,使得在 τ(J) 中至少存在两种翻译
形式 (x,y1),(x,y2),并且,y1≠y2,那么,这个 STDS
在翻译时是歧义的。
下页
6.1 句法分析与用作翻译的理论基础
2010-5-20 第 6章句法 (语法 )与语义理论及分析 17
如果一个系统中存在两个不同的行式为
A→α,β 和 A→α,γ 的规则,则说明这些
规则反映了语义歧义性。 即,使用输入文
法中的产生式 A→α 时,输出文法提供了或
A→β,或 A→γ 的选择性。
下页
返回
6.1 句法分析与用作翻译的理论基础
2010-5-20 第 6章句法 (语法 )与语义理论及分析 18
6.2.1 短语结构语言
定义 1,一个句子是一个符号串,这个串由选自某
种语言词汇表中的一个或多个符号 (词 )组成。
定义 2,一种语言是一个句集,它包含了属于这种语
言的全部句子。
定义 3,一部语法是对一个句集的一种有限的形式化
描述。
6, 2 其它相关语法介绍
下页
2010-5-20 第 6章句法 (语法 )与语义理论及分析 19
语法可采用不同形式来定义。如果一种语言只包含
有限句子,那么可以通过逐一枚举的方式来定义。
然而大多数有研究价值的语言通常都拥有无限多个
句子。描述这类语言的方法之一是编一部程序,然
后读入一个符号串,让机器判断是不是一个句子。
这样的程序叫做这种语言的识别器。另一种描述方
法是利用一种基于产生式的形式化工具。这种被广
泛用来描写形式语言和自然语言的工具被称为产生
式语法或短语结构语法。
下页
6, 2 其它相关语法介绍
2010-5-20 第 6章句法 (语法 )与语义理论及分析 20
6.2.2 短语结构语法
一部短语结构语法 G可以用如下的四元组来定义,
G=(T,N,S,P),其中:
T是终结符的集合,终结符是指被定义的那个语言的
词 (或符号 );
N是非终结符的集合,这些符号不能出现在最终生成
的句子中,是专门用来描述语法的。显然,T和 N的并
构成了符号集 V,而且 T和 N不相交,因此有,
V=T∨N
T∧N=Ф (Ф 表示空集 )
下页
6, 2 其它相关语法介绍
2010-5-20 第 6章句法 (语法 )与语义理论及分析 21
S是起始符,它是集合 N中的一个成员 ; P是一个产生式规
则集。每条产生式具有如下形式, a→b
其中,a∈V+,b∈V*,且 a≠b;V* 表式由 V中的符号所构成
的全部符号串 (包括空符号串 Φ) 的集合,V+表示 V*中除 Φ
以外的一切符号串的集合。
在一部短语结构语法中,基于运算就是把一个符号串
重写为另一个符号串。如果 a→b 是一条产生式,就可以通
过用 b来臵换 a,重写任何一个包含子串 a的符号串,并用
符号 " "表示对符号串所作的这种运算。所以,如果
u,v∈V+,
有,uav → ubv
G
下页
6, 2 其它相关语法介绍
2010-5-20 第 6章句法 (语法 )与语义理论及分析 22
就说 uav直接产生 ubv,或 ubv是由 uav直接推导出来的。
举例来说,如果定义了一部语法 G,其中 S是起始符,
且 N={S}
T={a,b,c}
P={S → aSC,
S→b}
于是从串 S开始,应用第一条产生式可得到串 aSc,然
后应用第二条产生式得到串 abc,S → aSC → abc
G G
或者可以重复应用第一条产生式两次,然后再用
第二条产生式,得到 S → aSc → aaScc → aabcc
G G G
下页
6, 2 其它相关语法介绍
2010-5-20 第 6章句法 (语法 )与语义理论及分析 23
如果 S1,S2,…,Sn 都是符号串,且
S1 → S2 → … → Sn
G G G
记作 *
S1 → Sn
G
就是说 S1产生 Sn,或者说 Sn是由 S1推导出来的。因此,
对于上面的简单语法有
*
S → abc
G
*
S → aaScc 等等。
下页
6, 2 其它相关语法介绍
2010-5-20 第 6章句法 (语法 )与语义理论及分析 24
通过以不同的顺序来应用这些产生式,就可以从同一
符号产生许多不同的串。由一部短语结构语法定义的语言
就是可以从起始符 S 推导出来的全部终结符串的集合。可
见,由上面这部简单语法所定义的语言是
b,abc,aabcc,aaabccc,…
一个程序如果能根据一部特定的语法来确定一个句子
的推导,就称它为一个句法分析器。
下页
6, 2 其它相关语法介绍
2010-5-20 第 6章句法 (语法 )与语义理论及分析 25
一般来说,如果把语法 G定义的语言记作 L(G),则
L(G)={W│W∈T*,且 S W}
这条定义的意思是,对于所有符号串 W,如果 W是由终结
符所组成的串,且用语法 G可以从起始符 S中推导出 W,那么
符号串 W的集合就是语法 G 所生成的语言 L(G)。
换言之,一个符号串要属于 L(G)必须满足两个条件,
(1) 该符号串只包含终结符 ;
(2) 该符号串能根据语法 G从起始符 S推导出来。
下页
6, 2 其它相关语法介绍
2010-5-20 第 6章句法 (语法 )与语义理论及分析 26
6.2.3 递归语言
理论语言学家在描述句集 (即语言 )时,经常使用这两个
慨念,递归语言和可递归枚举语言。如果我们能编一个程序,
使之以某种顺序逐个的输出 (即枚举 )一种语言的句子,我们
就说这种语言是可递归枚举的。如果能编写一个程序,它读
一个符号串后就能判断这个串是或不是某种语言的一个句子,
我们就说这种语言是递归语言。尽管这两个定义我们看起来
十分相似,但它们却是不同的。一种语言是可递归枚举的,
却不一定是递归的。假设给定某种可递归语言并且存在某种
机制来枚举这种语言的句子。
下页
6, 2 其它相关语法介绍
2010-5-20 第 6章句法 (语法 )与语义理论及分析 27
如果现在又给定一个符号串,并要求回答这个符号串是
否是这种语言的句子,那么,把每个句子拿来同这个符
号串匹配,若成功说明这个符号串是这种语言的一个句
子。但失败并不能肯定这个符号串不是这种语言的句子,
因为下一个生成的句子就可能与这一符号串匹配。这就
说明一种语言是递归枚举的,但却不一定是递归的。
短语结构语法可用来描述任何一种可递归枚举的语
言,可以建立一部语法,但却不可能靠程序判定一个输入
串是不是该语法定义的语言的一个句子。
下页
6, 2 其它相关语法介绍
2010-5-20 第 6章句法 (语法 )与语义理论及分析 28
用计算机处理语言,进行机器翻译,就是想编一个程序,
根据一部语法来确定一个输入的符号串是不是合乎语法的句
子。对于任何无约束的短语结构语法来说,要编写这样一个
程序是不可能的。
为此考虑受限短语结构语法,施加某些约束,保证生成
的语言是递归的,并且比较容易编写有效的程序来分析这些
语言,容易的程度取决于具体的约束。
下页
6, 2 其它相关语法介绍
2010-5-20 第 6章句法 (语法 )与语义理论及分析 29
与我们关系最密切的受限短语结构语法都是乔姆斯基体
系的成员。乔姆斯基 (N.Chomsky)定义了以下四类语法,
(1) 0型语法, 无约约束短语结构语法 ;
(2) 1型语法, 上下文有关语法 ;
(3) 2形语法, 上下文无关语法 ;
(4) 3型语法, 正则语法,
型号愈高所受约束就愈多,生成能力愈弱,因此能
生成的语言集也就愈小。
下页
返回
6, 2 其它相关语法介绍
2010-5-20 第 6章句法 (语法 )与语义理论及分析 30
6.3.1 机器翻译使用语法分析的过程
机器翻译的研究目的就是让计算机能够自动翻译人类的
自然语言,这样的处理过程应该包括查机器词典、进行语
法分析,参照背景知识进行语义分析等若干步骤,才能比
较好的把源语言的句子翻译为目标语言的句子。
在机器翻译的过程中,分析占有特殊重要的地位。分
析阶段人们的划分虽然并不统一,但各个机器翻译系统一
般都有形态分析、语法分析和语义分析这样三个阶段。而
且它 们 应 该是必不可少的比较重要的三个阶段。
下页
6, 3 语法分析在机器翻译中的应用
2010-5-20 第 6章句法 (语法 )与语义理论及分析 31
所谓形态分析,是指从输入的字符串序列分解出单词。
一般认为,英语的各个单词是间隔开的,形态分析比较
容易;而汉语句子中的词是连写的,词与词之间没有空
格,这就给汉语的形态分析增加了大的困难。
所谓语法分析是指已经输入的单词序列能不能构成合
法的句子,这显然要依赖于所采用的文法规则。
例如:兔子吃草
草吃兔子
这两句话符合,<句子 >←→< 名词 ><动词 ><名词 >
下页
6, 3 语法分析在机器翻译中的应用
2010-5-20 第 6章句法 (语法 )与语义理论及分析 32
当然,如果弄清那个名词应该是主语,那个名词应该是宾语
这样的语句分析就可以确定是不是正确。这应该纳入语法分
析的范畴,有的文献把这样的分析列入语义分析的范畴,这
样做语义分析的任务太繁重了。
所谓语义分析就是要弄清句子中词的含义,解决句子
中意义的不同或可不可能搭配,引进上下文信息,例如有这
么两句英语:
( 1) The fish was bought by the cook;
(2 ) The fish was bought by the river;
这两句的译文是:鱼是厨师买的,鱼是从河边买的。不
难理解,这两句的翻译与, 兔子吃草, 不同,它不是主语、
宾语颠倒,只能靠语义分析解决。
下页
6, 3 语法分析在机器翻译中的应用
2010-5-20 第 6章句法 (语法 )与语义理论及分析 33
6.3.2 模式匹配及应用
对机器翻译系统的分析部分来说,模式匹配
的本质特征就是把输入的句子作为一个整体看待
并给以相应的解释,而不去分析句子的单词或者
句子的其它更基本的成分的结构关系与语义关系。
具体的办法是在机器翻译系统中存储大量的模式
(句型就是一种模式,作为模式的句型很象学习
外语时经常使用的替换练习句型),每个模式都
对应了一个解释(或者称为目标表达式)。
下页
6, 3 语法分析在机器翻译中的应用
2010-5-20 第 6章句法 (语法 )与语义理论及分析 34
机器翻译系统将输入的句子同模式一一
进行比较,如果匹配,则转移到相应的解释
后续部分,再作进一步的处理。实例句型转
换的翻译就是采用的这一方法,那里的模式
就是双语句型结构表达式,匹配就是寻求相
同的句型。
下页
6, 3 语法分析在机器翻译中的应用
2010-5-20 第 6章句法 (语法 )与语义理论及分析 35
6.3.3 转换语法及应用
6.3.3.1 转换语法概述
由于自然语言本质上是上下文有关的,若
用上下文无关语法描述自然语言必然有很多不
合适的地方。上下文无关语法反映的只是一个
句子的生成过程。它所生成的句子不可能与另
外的句子发生关系,而在自然语言中这种关系
又是客观存在的。在这种情况下,可以采用转
换语法。
下页
6, 3 语法分析在机器翻译中的应用
2010-5-20 第 6章句法 (语法 )与语义理论及分析 36
转换语法与上下文无关语法相比,它在说明自然语言的规
律性方面要好得多;但其缺点是:用计算机实现时,效率
非常差。主要原因是经过转换,转换操作是在深层的树结
构上进行的,而不是在字符序列上进行的。
一部转换语法由一个基础部件和一个转换部件组成,
基础部件是一部上下文无关语法它产生一组深层结构的树;
转换部件是一组树的重写规则,把它们应用于一棵深层结
构树,便产生一棵或者多颗表层结构树。表层结构树的前
沿(终结节点序)就是语言的句子。转换语法的结构是很
容易被人看懂的。
下页
6, 3 语法分析在机器翻译中的应用
2010-5-20 第 6章句法 (语法 )与语义理论及分析 37
6.3.3.2 基于转换的句法分析器
转换语法可以用于句法分析,这就是句法分
析器。虽然转换语法所表达的释义关系简化了后
继阶段的处理,但是转换规则是为深层结构设计
的,若用它来处理表层结构就很复杂。归纳起来,
至少有三个基本问题:
( 1)对于一个给定的句子,它可以生成一组
句法树。这组句法树应当包括转换语法要分配给
这个句子的全部表层树;
( 2) 对于不属于基础的一棵给定的树,确
定生成这棵树可能使用的转换规则;
下页
6, 3 语法分析在机器翻译中的应用
2010-5-20 第 6章句法 (语法 )与语义理论及分析 38
( 3)可以有针对性对转换规则逐条进行判定,
如果它的结果就是当前的这棵树,就不再执行
这一条规则。
如果我们用最直接的方式来处理这些问题,
那么我们可能不得不尝试许多错误的途径。当
然,对于第一个问题可以用一部上下文无关语
法来产生转换语法可能分配给一个句子的全部
表层树,其数量可能很大,这样的语法又叫做
覆盖语法。
下页
6, 3 语法分析在机器翻译中的应用
2010-5-20 第 6章句法 (语法 )与语义理论及分析 39
例如,在英语语句中的大多数词都拥有不
止一个词类,这样就会使这种, 错误的, 表层树
的繁殖更为严重。
对于后两个问题,可以设计出一组逆向转换
规则。
综上所述,它们的处理过程由四个步骤组成:
( 1)首先,程序可以利用上下文无关的覆
盖语法,通过一个自底向上的句法分析器来一步
一步分析输入的句子;
下页
6, 3 语法分析在机器翻译中的应用
2010-5-20 第 6章句法 (语法 )与语义理论及分析 40
( 2)应用逆向转换规则;
( 3)对步骤( 1)和( 2)所产生的每一颗侯选的
基础树,检查它们是不是事实上能够由基础部件
所生成;
( 4)对每棵基础树和通过步骤( 3)的测试的转
换规则序,应用正向转换规则以证实原先的句子
确实可以生成。
下页
6, 3 语法分析在机器翻译中的应用
2010-5-20 第 6章句法 (语法 )与语义理论及分析 41
第四步中最后检查是必要的,因为覆盖语法有可能在
逆向转换过程中导致输入句子同一个转换发生虚假的匹配,
而且逆向转换不见得包括了正向转换中的全部约束。
事实上,覆盖语法产生了大量虚假的表层分析,这就
对于机器翻译系统后继的处理过程造成了很大的压力。
也可以采用两个方法来提高系统的速度:
( 1), 超树,,即用一个单独的结构来表示几棵语
法树。寄希望对这些超树应用逆向转换规则,以便能同时
处理几种可能的表层结构;
下页
6, 3 语法分析在机器翻译中的应用
2010-5-20 第 6章句法 (语法 )与语义理论及分析 42
( 2)拒绝规则:在逆向转换的过程(可见步骤
( 2))中应用这些拒绝规则来对树进行必要的测
试,以便可以在句法分析的过程中尽可能早地淘
汰某些虚假的树。在拒绝规则中收进了原先只出
现在正向转换部件中的某些约束,从而可以删除
步骤( 2)中的某些树,这样,就可以不让它们继
续存在到步骤( 4)了。
下页
6, 3 语法分析在机器翻译中的应用
返回
2010-5-20 第 6章句法 (语法 )与语义理论及分析 43
6.4.1 汉语语法概述
汉语语法的特点可以归纳为以下七个方面:
( 1)句子之中缺少形态标志,即每个词缺少外
部形态标志,所以组词或者组句不靠形态变化,
而是靠语序和虚词。
首先我们来看汉语语法的语序问题,汉语
如果跟拉丁语相比,拉丁语中, 老王打小李,
这样一句话可以任意安排顺序;但在汉语中,
如果把, 老王打小李, 变成, 小李打老王, 意
思就相反了,因此可见汉语语序的重要性 。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 44
其次,汉语的虚词很丰富,在不影响语义的前提
下,用不用虚词带有很大的灵活性,这是西方语言
所没有的。
在印欧语这样的语系里,其主语、宾语一般都
由名词来充当,谓语一般则由动词充当,定语大多
数由形容词充当; 在汉语中,大家知道,名词并不
总是都用作主语和宾语,也可以作定语甚至谓语。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 45
例如,春节到了。(主语)
我在中国过春节 。(宾语)
春节晚会开得好。 (定语)
明天春节了。(谓语)
在汉语中,它们的语句中被人们认为是动词的并不
总是作谓语,也可以作做主语、宾语或者定语。例如:
我们回去 。(谓语)
回去行,不 回去也行。(主语)
回去的日子不远了。(定语)
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 46
( 2)汉语的构词法和造句法的结构规则基本相同。
语素构成词,词构成短语和句子,都用一套共同的
规则。
( 3)汉语具有主题化的倾向。汉语习惯上把最重
要的一个词或者短语放在句首做主语,其余部分作
谓语(包括其它部分)。
( 4)汉语动词没有西方语言那种时态变化,汉语
的时主要靠时间词、副词和上下文来进行表示。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 47
例如:
昨天他写了一篇论文。(过去完成时)
你看,他借了一支笔。(现在完成时)
等我上完课再去看电影。(将来完成时)
( 5)一般情况下,只要认为不会影响汉语的某个句子的语
义表达,这个汉语句子的主语就可以被省略。
( 6)有丰富的量词也是现代汉语的一个特点,并且不同的
名词要和不同的量词搭配。例如:一本书、一张纸、一匹
马等等。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 48
( 7)在汉语中,词的搭配有一定规则。
例如:, 加以,
一般说:加以考虑(对),加以想(错)
,进行,
一般说:进行学习(对,进行学(错)
,颇为,
一般说:颇为优越(对),颇为好(错)
,极为,
一般说:极为丰富(对) (,极为多(错)
,伟大,
一般说:伟大祖国(对),伟大国(错)
,严重,
一般说:严重灾害 (对),严重灾(错 )
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 49
6.4.2 汉语语法单位和句子成分
汉语的语法单位也是由语素、词、短语、句子等四级
构成。
词可分为单纯词和合成词两种。
汉语合成词有如下三个特点:
( 1)意义的组合。例如, 奶粉, 不说成, 牛奶粉, ;
,豆腐, 不说成, 黄豆腐, 。
( 2)词的内部结构一般由两个直接成分组成。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 50
( 3)有很强的双音化倾向,经常把单音词凑成
双音词。例如, 老虎,老鼠, 等等,这里的, 老,
纯粹是音节所必须的。
汉语的词又可以分成实词和虚词两大类。实
词和虚词的区别主要在于前者是内容词,而后者
是功能词。
短语由词构词,是意义上和语法上能搭配的
一组词。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 51
根据词和短语在句子里的组合位臵和语义的
特定关系,可以把汉语句子成分分为八种, 即主
语、谓语、述语、宾语、补语、定语、状语和中
心语。这八种成分既体现了结构关系,又体现了
语义关系。
这些关系中,主语是和谓语相对的直接成分,
述语是和宾语或者补语相对的直接成分,状语是
和谓语性中心语相对的直接成分。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 52
主语和谓语的关系:先要传递的信息放前面,
这就是主语;后面是对前面的说明,就是谓
语。主语代表已知信息,谓语说明信息。从
语义关系看,主语和谓语的关系可以看成动
作者和动作的关系。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 53
述语与宾语、补语从语义关系考虑,述语
表示动作或者状态,宾语和补语则表示动
作或者状态涉及的事物、时间和数量等。
定语和状语都是修饰语。一般情况下,
名词性中心语前面的修饰语是定语,谓语
性中心语前面的修饰语是状语。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 54
在汉语中,定语和状语一定放在中心语前;
特殊情况下,汉语的状语跟中心语相互交
换位臵。定语在于限制或者描述中心语。
状语所表示的意义非常广泛,包括方向、
时间、频度、情态和方式等。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 55
6.4.3 汉语句子分析方法
有两种比较流行的分析方法:
( 1)句子成分分析方法
句子成分分析方法的主要点是把构成句子的成分分成
六种:主语、谓语、宾语、补语、定语和状语。分析句子
实际上就是说明句子成分的搭配情况。但是大量的事实表
明,有些复杂的句子结构不是用这种简单的方法能够划分
清楚的。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 56
句子成分分析方法的最大缺点是不重视语言结构
的层次。例如,句子成分分析方法无法区分以下
两个句子:
这位工人的建议很好。
这项工人的建议很好。
句子成分分析方法对这两个句子的分析结果都是:
定语 — 定语 — 主语 — 状语 — 谓语
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 57
( 2)层次分析方法
层次分析方法认为,任何语法结构都是有层次的,
每个层次通常由两个直接成分组成,语法分析必须逐层
进行,原则上都可以把各层的语言单位分为两个(或者
多个)直接成分,一直分到不可以再分为止。
这种分析方法能够简单而清楚地把句子结构显示出
来。这样一种优点在分析多义的短语和句子时表现得最
明显。例如,两个 国家的企业
两个国家 的企业
显然,前句指一个国家的两个企业;后句指两个国
家的企业。层次分析方法仍然有必要吸取句子成分分析
方法的优点,因为层次分析方法没有把直接成分之间的
结构关系显示出来。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 58
例如:, 烤羊肉, 可以是一种食品,也可以说明在烤这
个羊肉,但是它的层次结构并不能区分这两种关系。
如果采用句子成分分析方法,就能显示出这样的关系:
烤 /羊肉(名词短语)
烤 /羊肉(动宾结构)
汉语还有一个现象值得注意,即某些词不与一个词搭配,
必须跟一个短语搭配。作为一个简单的例子可以看到,
副词, 很, 一般都不能修饰那些单个的动词,但是它却
能够修饰宾式动词短语。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 59
如:很有兴趣
很解决问题
可以再作进一步的考察看到,副词往往是
不能够修饰述语的,但是它却能够修饰整个述
补短语。
如:不吃得过饱
都长得美清目秀
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 60
6.4.4 英语语法概述
这里的英语语法是以生成语法为理论基础
的,主要研究句子结构和句子的各成分在构成
一个句子时所起的作用,以及它们之间的相互
影响。这样的英语语法是面向机器翻译系统的
语法。它以句子结构为主线,侧重考虑如何构
造一个合格的英语句子,以及每个句子成分之
间的相互关系,还包括它们在句子中所起的作
用。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 61
在英语中,词构成短语,短语构成句子。词是构成句子
的基本单位,根据形式、意义及其在句子中的功能,英
语划分为十大词类:
( 1)名词 如,book,worker
( 2)代词 如,he,you
( 3)形容词 如,capable,related
( 4)数词 如,one,twenty
( 5)动词 如,derive,get
( 6)副词 如,presently,currently
( 7)冠词 如,a,the ( 8)介词 如,in,from
( 9)连词 如,and,or ( 10)感叹词 如,oh,alas
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 62
比较多的情况下,英语中的词先构成断语。短语是意
义上的一个单位,其种类很多,英语中常用的基本短语有
以下几种:
( 1)动词短语
( 2)形容词短语
( 3)名词短语
( 4)位臵短语
( 5)倾向短语 表示运动的方向或者运动的趋势。
有些英语句子由一个或者一个以上的从句构成。从句
是由关联词引导,内部含有主语、谓语,意义上像句子,
但语法上不能成为独立句子的一组短语。从句主要包括主
语从句、表语从句、宾语从句、定语从句和状语从句。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 63
通过分析不难了解,不同的短语在句子中的功能不同,
构成了不同的句子成分。英语的句子成分主要有以下六种:
( 1)主语 是句子所要说明的事物,是一个句子的主体;
( 2)谓语 是说明主语的动作和状态的;
( 3)表语 是放在系动词之后表示主语的身份或者特征的;
( 4)宾语 一般是表示及物动词动作的对象的,但是在英
语中介词后面的名词或者名词短语叫介词宾语;
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 64
( 5)定语 是限定或者修饰名词用的;
( 6)状语 是修饰动词、形容词、副词或者全句用的。
通常情况下,英语中的主语由名词短语或者从句构成,谓语
由动词短语构成,而补语由名词短语或者形容词短语或者从
句构成,而修饰成分一般由形容词短语、副词短语、位臵短
语、倾向短语或者从句构成。 句子由主语和谓语构成,有
比较完整的意义。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 65
6.4.5 英语中词的作用
6.4.5.1 英语动词
动词是一个英语句子的核心部分。
英语动词可以分为五类:
( 1)及物动词; ( 2)不及物动词;
( 3)系动词; ( 4)助动词; ( 5)情态动词。
在英语中,许多情况下一个动词一般可以用作不同类
的动词。有些动词和一些别的词构成固定的短语,表达了
一个概念,作用和一个单独的动词差不多,这就是短语动
词。动词与它的补语搭配构成动词短语。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 66
英语动词充当谓语时,其形式要受到主语的限
制,即为动词的限度形式,主语对动词的限制
表现在人称、数、时态、语态和语气上。动词
还有一种不受主语限制的形式,即动词的非限
定形式。这种形式不能独立作谓语,但是可以
和助动词或者情态动词等构成谓语,还可以在
句子中充当主语、宾语、状语、定语和表语等。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 67
英语动词一共有十六种时态,其中最常用的有四
种,即:
一般现在时;现在进行时;现在完成时; 一般
过去时;
当谓语表示一个动作时,主语和它可以有两种不
同关系,即主动关系和被动关系。在表示主动关
系时,谓语的形式称为主动语态;在表示被动关
系时,谓语要用被动语态。在被动结构的句子中,
动作执行者可以由介词 by 引起的短语表示。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 68
英语动词有三种非限定形式,即:
( 1)动名词 英语中的动名词主要是起名词的作用,一般
都可以被用作主语和补语,这里表示为动词 +ing。
( 2)分词 英语中的分词许多场合下主要起形容词的作用,
一般都可以被用作补语和修饰成分。英语的分词有两种,它
们是过去分词和现在分词。现在分词和动名词的形式是完全
相同的,过去分词表示为动词 +ed 。
( 3)不定式 不定式能够起名词的作用,也能够起形容词
的作用,可以作主语、补语和修饰语,表示为 to + 动词。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 69
6.4.5.2 英语中心词和它们的补语
英语中的短语在构成更大的短语或者构成一个
句子时,它的功能由短语中一个被称为中心词的单
词决定,中心词的词性和形态决定了整个短语在句
子中的功能。短语的中心词不同,它在句子中发挥
的作用也不同。不同词性的中心词构成不同类型的
短语。
在英语句子之中,通常一个短语是由中心词和
中心词的补语构成的,补语对中心词起补充和说明
的作用。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 70
补语在构成短语的过程中起到了重要的作用,补语
与作为中心语的单词会相互影响,可以反映短语的
中心语的某些性质。中心语的词性不同,它所要求
的补语也不同。补语的选择与不同的单词有很大的
关系。
补语有下列三种:
( 1)动词的补语; (2)形容词的补语; (3)名词
的补语。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 71
6.4.5.3 英语名词短语
在大多数英语句子中,它们的主语和动词的补语是由名
词短语构成的。名词短语构成形式多种多样,有 the + 普
通名词构成 NP,代词和专有名词也可以构成 NP,名词短
语的所属格 + 普通名词短语也是 NP等等。
一般情况下,名词短语有以下五类:
( 1)代词和专有名词短语;
( 2)普通名词短语;
( 3)由限定词、名词属格、不定冠词引出的名词短语;
( 4)由量词引出的名词短语;
( 5)由量词加一个 of 短语。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 72
6.4.6 英语从句
在英语中,英语从句是由关联词 + 主语 + 谓语构
成的,英语从句去掉关联词以后,非常像一个句子。但是
从句在语法功能方面不能独立成立,所以叫做从句。从句
可以分为名词性从句和修饰性从句两大类:
6.4.6.1 名词性从句
名词性从句在复合句中的功能与 NP相同,作主句的主
语、动词的补语和介词的宾语。典型的名词性从句还可以
有以下几类:
( 1) That 语句;
( 2)非限定性从句;
( 3)间接疑问句。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 73
6.4.6.2 修饰性从句
修饰性从句又可以分为两种:
( 1)修饰 NP的定语从句;
英语的 定语从句所修饰的词被叫做先行词,定语
从句必须要放在先行词之后。引导 定语 从句的这些关
联词有 who,whom,whose,which,when,
where,that等等。当然,在英语中也有些定语从句
没有关联词引导。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 74
定语从句的结构有以下三种形式:
[1]一个由关联词引导的短语 + 缺少一个与关联
词引出的短语具有相同词性的短语的句子这样的
结构形式;
[2]that + 一个缺少 NP的句子;
[3]一个缺少 NP的句子。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 75
如果定语从句是由关联词 that引导,或者
根本没有关联词,那么这个从句所缺少的部分
即为它所修饰的先行词。
如果定语从句是由其他关联词引导,则先行
词可以代表关联词,而关联词引导的短语相当
于从句所缺少的部分。
下页
6,4 汉语和英语语法的概述
2010-5-20 第 6章句法 (语法 )与语义理论及分析 76
( 2)修饰 VP,AP等的状语从句
状语从句在句子中作状语,可以修饰主句
中的 VP,AdjP,AdvP等。状语从句由从属连词
引导,状语从句的位臵可以放在句子首部或者句
子末尾。放在句子首部时,从句后面常常用一个
逗号;放在句子末尾时,从句前面不用逗号。
状语从句可以分为时间、地点、原因、目
的、结果、方式等等。
下页
6,4 汉语和英语语法的概述
返回
2010-5-20 第 6章句法 (语法 )与语义理论及分析 77
6.5.1 语义分析概述
自然语言语义分析和机器翻译语义分析技术是比较重
要的一环。什么是语义分析呢?就是在语法分析之后,通
常要进行句子意义上正确与否的检查 —— 语义分析。对同
一个自然语言的输入,语法分析的结果往往会得到若干不
同的分析树。
例如:指导研究生的工作是重要的
这句话,可以有以下三种结构:
( l)指导 研究生的工作 是重要的
( 2) 指导 研究生 的工作 是重要的
(3) 指导研究生 的工作 是重要的
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 78
但从语义的角度看,这句话的意思只能是( l)
或者是( 2)而不会是( 3)。因为在汉语中不存在
,指导研究生, 这个名词短语。如果把这句话中的
,研究生, 换成,‘ 教师,,语法分析的结果不
变,但是其意思大概是 (3),而不是 (l)和 (2)。
还有,如果说:培养教师的工作是重要的
则只有第 (2)种结构才是适当的 ;
培养 教师 的工作 是重要的
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 79
因此,语义分析是必要的。语义分析就是要识别一句话所
表达的实际含义,说很明确些,那就是要弄清楚, '
干什么了,,, 谁干的,,, 这个行为的原因或结果是什
么,,以及, 这个行为发生的时间地点以及所使用的工
具, 等等。为了弄清楚这些关系,必须要有关于客观真
实性界的知识。
例如:, 吃, 这个动词通常指的是动物的行为,这
个行为的主体应该是动物,这个行为的对象是, 可以吃
的东西, 。系统中有了这些知识,就可以进行语义分析。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 80
语义分析还有一个重要内容,就是要能够进行推理,
即从巳知的事实和规则推断出合理的结论。
例如,从, 鸟会飞, 这一大前提和, 燕子是鸟, 这
一小前提,根据三段论法的推理规则能够得到, 燕子会
飞, 的结论。
把理解了的内容用什么方式表现出来随着系统应用
目的的不同而有所变化。例如,在情报检索问答系统中,
可以用检索式 ; 在机器翻译系统中,可以表现为代词
指代的确定,省略语句的恢复、意译信息的获取 ; 在
文章理解系统中,可以表现为关键信息的抽取、登场人
物关系的确定等等。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 81
尽管应用形式多种多样,但是有关语义和知
识的形式表达及推理机制却有一定的普遍性。这
方面的研究也是人工智能领域的中心课题。
虽然语法分析和语义分析是不同层次的工作,
但在实际系统中并非都是截然分开的。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 82
6.5.2 语义分析方法
6.5.2.1 语义语法方法
语义语法的表示方法与上下文无关语法相似,
但是语义语法不使用, 名词短语,,, 名词,,
,动词, 等这样的不含有语义信息的纯语法成分,
而代之以象, 人类,,, 动物,,, 植物, 这样
的有很强的语义约束的范畴。这样就可以排除诸
如, 白菜吃兔子, 之类无意义的句子。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 83
为了说明语义音符是怎样使用的,可以考察下面一些
重写规则:重写规则的形式与上下文无关语法一样,
没有什么需要了解的。其内容也是上下文无关语法。
这个语法只使用几条规则,也可以识别一些输入。
语义语法不仅可以排除无意义的句子,而且分
析的效率也很高。但是,语义语法只能适用于严格限
制的领域。当要把这种分析技术从一个应用领域移植
到另一个应用领域时,改写语法的工作量很大,甚至
要完全重写。因此这种语法只有实用价值,而不适
合作语言学研究的一般模型。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 84
6.5.2.2 格语法方法
格的概念是当要理解一句话的意义时,首先明确判
定一句话当中在语义上居支配地位的成分是有用的。例如,
Mickey talked to him
这句话中,Mickey是名词,作主语,talked是动词,作谓
语。可能会以为,既然名词作了, 主语,,那一定是名词
起主要作用了。我们知道,在英语国家 Mickey既可以是人
的名字,也可以是猫狗的名字。如果就这句话问,Mickey
是人的名字还是动物的名字。恐怕回答是人的名字者居大
多数,这是因为 talked(说话了 )是人的行为。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 85
同样,如果针对 Mickey barked at him
这句话提同样的问题,则回答 Mickey是狗的名字者应该居
大多数,这是因为 barked(吠叫了 )通常是指狗的动作。
由此可见,不是主语支配动词,而是动词的意义起支配全句
的作用。当着眼于语义分析一个句子时,按照格语法的观点,
首先要确定这句话中的中心动词是什么,然后再确定其它成
分与这个动词的关系。如有的是执行这个动词的动作的主体
(施事),有的是动作所作用的对象 (受事 ),有的是执行这
个动作的工具以及其它种种关系。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 86
例如,He opened the door with the key.
在这句话中,open是中心动词,He是施事,door是受事,
key则是工具。
格语法的提出者把这些反映语义的关系分别叫做动作
主格、受动者格(或对象格、工具格等等。这些格的概念
固然起源于语法学中的主格、宾格、所有格等这样的用语,
但格语法的格概念与传统语法的格慨念有本质的不同。传
统语法书的格反映的只是词尾的变化规则,是表层的格。
格语法的格反映的是语义关系,认为这种语义关系在人说
话之前就存在于人的头脑之中。因此是深层的格。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 87
再看以下两句话:
The key opened the door
The door opened.
从格语法的观点看,尽管 key可能作一句话的表层的
主格,对于动词 open,它总是深层的工具格,无论 door
作句子的表层的宾格还是主格,它总是动词 open的受动
者格。
应用格语法时,首先碰到的一个问题就是,为了反
映客观存在的语义关系,应该规定多少格以及这些格的
明确含义。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 88
Fillmore提出了以下八种格,
(1) Agent 动作主格
(2) Counter-Agent 反动作主格
(3) Object 受动者格
(4) Result 结果格
(5) Instrument 工具格
(6) Source 来源格
(7) Goal 目标格
(8) Experience 经验者格
不同的语言学家对此有不同的看法和建议,甚至关
于选择格的标准的看法都相距甚远。在众多的实验系统
或实际系统中,有的选用四、五个格,有的使用的格
的数目超过 30个。看来,得根据对象语言和应用领域进行
仔细的分析,作出切合实际的抉择。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 89
在格语法中,可以规定一共使用多少种格。但对每一个具
体的动词,并非都要具备所有的格。对于一个动词,如果某
个格是必须要有的,没有它就不能构成完整的句子,则这样的
格叫做必备格。
例如,动词 break(打碎 )就必须要有受动者格。
在下面的两个句子中:
In the room,he broke a window with a hammer.
The window broke.
window 是 break的受动者格。特别要注意到,第二个句子很短,
提供的信息很少,但它是一个完整的句子。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 90
The window尽管是语法上的主语,但它仍是
break的受动者格。由此可以看出,受动者格是
break的必备格。第一句中的其他格,象动作主
格 he,地点格 room,工具格 hammer都是选
用格。所谓选用格,指的是这样一种格,句子
中有了它,可以提供更多的信息,没有它也不
会破坏句子的完整性。某个动词不能有的格叫做
禁用格,例如目标格或方向格就是 break的禁
用格。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 91
格框架可以应用于上下文无关语法分析一个句子,
得到一棵语法树。这种语法树是依赖于词序的。应用格
语法分析一个句子时,得到的将是一个格框架,这种
格框架是不依赖于词序的,它不仅依赖于语法信息,而
且更多地依赖于语义信息。
一个格框架由一个主要概念和一组辅助概念组成,
这些辅助概念以一种适当定义的方式同主要概念相联系。
狭义地可以把主要概念理解为中心动词,可以把一组辅
助概念理解为动作主格、受动者格、地点格等各种语义
的深层的格。
对应于例句 In the room,he broke a window with
a hammer for Billy 的格框架可用一种简化了的一
般形式表述如下,
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 92
[BREAK
[case-fram
agent, HE
object, W!NDOW
instrument,HAMMER
reciplent,
directive,
locative, ROOM
benefactive, BILLY
co-agent,]
[modals
time, past
voice, active] ]
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 93
这种记述形式也是表( (list),其中主要概念是动词
BREAK,象 agent等各种格用小写字母表示,而句子中的词
作为格的填充物用大写字母表示。请注意,这里虽然也采
用了 8种格,但是这 8种格的名称和含义同 Fillmore建议的
并不完全相同。此外在框架中还包括 time,voice等情态
信息。
为了得到这样的格框架所记载的信息,必须要在系
统中准备一部组织得很好的辞典。对于动词,要规定每个
动词的必备格是哪些格,禁用格是哪些格。还要规定具有
什么样的语义的名词可以填入那些必备格和选用格。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 94
对于名词则要附加体系化的语义信息。这样,在应用格
语法分析自然晤言的句子时,不仅需要语法知识,而且
需要语义知识。
试比较以下两句话:
Johe broke the window with a hammar
John broke the window with Mary
从语法上看,它们是完全一样的。介词短语 with a
hammar 和 with Mary 都是修饰动词 broke的。但是上
一句的 hommar应填入工具格,下一句的 Mary则不能填入
工具格。在通常的情况下,John不会把 Mary当作砸窗子
的工具使,Mary应填入 co-agent格。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 95
可以想象,辞典中规定了 break的工具格应填入工具一类
的名词,对名词 hammar则应指明它是工具,而对名词 Mary
则通常指明它是人 (特别是女人 )的名字,当然也就不是
工具。
应用格框架的分析步骤可以分析上述介绍的格框架。
用于分析的格框架(即动词辞典中每个特定动词所有的
空架子 )的格式略有所不同,它应对于每个格,指明语义
信息和语法信息。
例如,Copy the FORTRAN files from the
system library to my directory
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 96
应用格框架,分析上面这个句子的具体步骤是:
( l)对子系统辞典中的每一个格框架,在输入序列的任
何位臵查找,有无与其相匹配的串,如果没有,则输入是不
能按照此格语法进行分析的。如果找到下一个或多个,
则对每一个执行以下分析,那些同整个输入串匹配的格框
架可能成为分析的结果。
( 2)根据识别的结果,按索引检索所需要的格框架。
( 3)识别必备格
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 97
[l]如果格带有位臵标志,则从指定位臵查找格
的填充物。
[2]如果格带有语法标志,则在整个输入序列中
查找有无该标志 (这是很简单的一、两个词的匹
配),如果找到了,则以该标志为起点,向右 (或
向左 )查找格的填充物。
[3]在查找格的填充物时,很有可能要用到更加
复杂的分析策略,例如,还有可能要识别嵌套的
格框架。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 98
( 4)按照同样的办法识别选用格。
( 5) 如果必备格和选用格都被处理了而输入序列中
还有未被识别的部分,这里就有了错误。或者是输入
到一个反映句子语义的实际的格框架。
从上面的分析可知这种方法把自底向上的过程与自顶
向下的过程 (寻找格槽的填充物 )有机地结合起来,大大
提高了分析的效率 ; 格语法可以递归地处理关系从句
和其它的语言结构;格语法综合运用语法 (位臵标志与
语法标志 )和语义的知识,从而减少了结构与词义的歧
义。这些优点使得格语法成为自然语言分析的有力手
段,至令仍在积极研究中。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 99
6.6.2.3 概念依存理论方法
先看两个具体的英语句子,
John gave Mary a balL
Mary took a ball from John.
如果用格语法分析它们,将会得到两个不同的格框架,
前者是动词 give的,后者是动词 take的。
动词 give的 agent是 John 动词 took的 agent是 Mary。
尽管这两句话的表现重点不一样,但是它们表达的事实却
是一样的。
在概念依存理论中,只使用一个原语概念 ATRANS表达
这两个动词动作(甚至更加广泛的意义)的语义。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 100
这两句英语表达式是:
[ ATRANS
rel, POSSESION
actor, JOHN
object, BALL
source, HOHN
recipient, MARY ]
" John gave mary a ball "
[ ATRANS
rel, POSSESION
actor, MARY
object, BALL
source, HOHN
recipient, MARY ]
" Mary took a ball from John "
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 101
对照一下这两个结构,容易看出,所发生的
两个事件在哪些方面是相同的,在哪些方面是
不同的。当在英语句子中分析至 give或 toke或
其它有相近意义的动词时,就调用 ATRANS(这是
Abstract TRANSFER 的缩写记号 )的框架以及
在此框架上建立的推理规则。
在概念依存理论中使用的格与格语法中的格
是相似的,但不完全相同。这一理论中一个稍细
的地方是把 agent区分为 actor和 source。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 102
6.5.3 语义分析小结
以上介绍的各种语义分析的技术虽然
为理解、处理自然语言以及机器翻译提供
了工具,类似的工具还有很多,但是它们
的成功都还是局限在某个方面或一定的范
围。自然语言的现象十分复杂,还有大量
的问题有待研究。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 103
人能够听得懂、看得惯病句的意思,计算机
怎样去理解有毛病的句子呢? 从键盘键入的
句子很难保证一个字母也不错漏吧? 如果让
计算机弄明白句中的参照关系,如,Tom
asked his father if he would buy
him a balL
这一句中的 his,he,him指的是 Tom还是 Tom
的父亲,人是能明白的,计算机如何能理解
其中的关系。一句话尚且如此,一篇文章、一
个剧本中的参照关系就更复杂了。
下页
6, 5 语义分析
2010-5-20 第 6章句法 (语法 )与语义理论及分析 104
人们说话、写文章时,常常省略掉一些成分和意思,
计算机到哪里去找回这些省略了的信息呢?
人们常常使用隐喻,计算机恐怕更难理解了吧?
同样一句话,不同社会地位、不同职业的人讲出来,
其意义和作用就很不一样。因此,孤立地研究语言本身
并不能最终地解决问题。
可以列举的问题还有很多。以上这些问题的解决一方
面需要多个学科的专家的联合攻关,一方面也要依靠具
备多学科知识的人起桥梁作用。有志于从事机器翻译研
究的专业人员应多方面地吸收新的知识,以丰富自己的想
象力和创造力。
6, 5 语义分析
返回返回首页