5 深入阅读
本章进一步的材料请参考http://nltk.org/
,包括特征结构、特征语法和语法测试套件。
X-bar 句法:(Jacobs & Rosenbaum, 1970), (Jackendoff, 1977)(The primes we use replace Chomsky’s typographically more demanding horizontal bars)。
协议现象的一个很好的介绍,请参阅(Corbett, 2006)。
理论语言学中最初使用特征的目的是捕捉语音的音素特性。例如,音/b/可能会被分解成结构[+labial, +voice]
。一个重要的动机是捕捉分割的类别之间的一般性;例如/n/在任一+labial
辅音前面被读作/m/。在乔姆斯基语法中,对一些现象,如协议,使用原子特征是很标准的,原子特征也用来捕捉跨句法类别的概括,通过类比与音韵。句法理论中使用特征的一个激进的扩展是广义短语结构语法(GPSG; (Gazdar, Klein, & and, 1985)),特别是在使用带有复杂值的特征。
从计算语言学的角度来看,(Dahl & Saint-Dizier, 1985)提出语言的功能方面可以被属性-值结构的统一捕获,一个类似的方法由(Grosz & Stickel, 1983)在 PATR-II 形式体系中精心设计完成。词汇功能语法(LFG; (Bresnan, 1982))的早期工作介绍了 f-structure 概念,它的主要目的是表示语法关系和与成分结构短语关联的谓词参数结构。(Shieber, 1986)提供了研究基于特征语法方面的一个极好的介绍。
当研究人员试图为反面例子建模时,特征结构的代数方法的一个概念上的困难出现了。另一种观点,由(Kasper & Rounds, 1986)和(Johnson, 1988)开创,认为语法涉及结构功能的描述而不是结构本身。这些描述使用逻辑操作如合取相结合,而否定仅仅是特征描述上的普通的逻辑运算。这种面向描述的观点对 LFG 从一开始就是不可或缺的(参见(Huang & Chen, 1989)),也被中心词驱动短语结构语法的较高版本采用(HPSG; (Sag & Wasow, 1999))。http://www.cl.uni-bremen.de/HPSG-Bib/
上有 HPSG 文献的全面的参考书目。
本章介绍的特征结构无法捕捉语言信息中重要的限制。例如,有没有办法表达NUM
的值只允许是sg
和pl
,而指定[NUM=masc]
是反常的。同样地,我们不能说AGR
的复合值必须包含特征PER
,NUM
和gnd
的指定,但不能包含如[SUBCAT=trans]
这样的指定。指定类型的特征结构被开发出来弥补这方面的不足。开始,我们规定总是键入特征值。对于原子值,值就是类型。例如,我们可以说NUM
的值是类型num
。此外,num
是NUM
最一般类型的值。由于类型按层次结构组织,通过指定NUM
的值为num
的子类型,即要么是sg
要么是pl
,我们可以更富含信息。
In the case of complex values, we say that feature structures are themselves typed. So for example the value of AGR
will be a feature structure of type AGR
. We also stipulate that all and only PER
, NUM
and GND
are appropriate features for a structure of type AGR
. 一个早期的关于指定类型的特征结构的很好的总结是(Emele & Zajac, 1990)。一个形式化基础的更全面的检查可以在(Carpenter, 1992)中找到,(Copestake, 2002)重点关注为面向 HPSG 的方法实现指定类型的特征结构。
有很多著作是关于德语的基于特征语法框架上的分析的。(Nerbonne, Netter, & Pollard, 1994)是这个主题的 HPSG 著作的一个好的起点,而(M{\”u}ller, 2002)给出 HPSG 中的德语句法非常广泛和详细的分析。
(Jurafsky & Martin, 2008)的第 15 章讨论了特征结构、统一的算法和将统一整合到分析算法中。