7 小结

  • 句子都有内部组织结构,可以用一棵树表示。组成结构的显著特点是:递归、中心词、补语和修饰语。
  • 语法是一个潜在的无限的句子集合的一个紧凑的特性;我们说,一棵树是符合语法规则的或语法树授权一棵树。
  • 语法是用于描述一个给定的短语是否可以被分配一个特定的成分或依赖结构的一种形式化模型。
  • 给定一组句法类别,上下文无关文法使用一组生产式表示某类型 A 的短语如何能够被分析成较小的序列α<sub>1</sub> … α<sub>n</sub>。
  • 依存语法使用产生式指定给定的中心词的依赖是什么。
  • 一个句子有一个以上的句法分析就产生句法歧义(如介词短语附着歧义)。
  • 分析器是一个过程,为符合语法规则的句子寻找一个或多个相应的树。
  • 一个简单的自上而下分析器是递归下降分析器,在语法产生式的帮助下递归扩展开始符号(通常是S),尝试匹配输入的句子。这个分析器并不能处理左递归产生式(如NP -&gt; NP PP)。它盲目扩充类别而不检查它们是否与输入字符串兼容的方式效率低下,而且会重复扩充同样的非终结符然后丢弃结果。
  • 一个简单的自下而上的分析器是移位-规约分析器,它把输入移到一个堆栈中,并尝试匹配堆栈顶部的项目和语法产生式右边的部分。这个分析器不能保证为输入找到一个有效的解析,即使它确实存在,它建立子结构而不检查它是否与全部语法一致。