6 练习
☼ 需要什么样的限制才能正确分析词序列,如 I am happy 和 she is happy 而不是you is happy 或they am happy?实现英语中动词 be 的现在时态范例的两个解决方案,首先以语法(6)作为起点,然后以语法 (18)为起点。
☼ 开发1.1中语法的变体,使用特征<cite>count</cite>来区分下面显示的句子:
fs1 = nltk.FeatStruct("[A = ?x, B= [C = ?x]]")
fs2 = nltk.FeatStruct("[B = [D = d]]")
fs3 = nltk.FeatStruct("[B = [C = d]]")
fs4 = nltk.FeatStruct("[A = (1)[B = b], C->(1)]")
fs5 = nltk.FeatStruct("[A = (1)[D = ?x], C = [E -> (1), F = ?x] ]")
fs6 = nltk.FeatStruct("[A = [D = d]]")
fs7 = nltk.FeatStruct("[A = [D = d], C = [F = [D = d]]]")
fs8 = nltk.FeatStruct("[A = (1)[D = ?x, G = ?x], C = [B = ?x, E -> (1)] ]")
fs9 = nltk.FeatStruct("[A = [B = b], C = [E = [G = e]]]")
fs10 = nltk.FeatStruct("[A = (1)[B = b], C -> (1)]")
在纸上计算下面的统一的结果是什么。(提示:你可能会发现绘制图结构很有用。)
fs1
andfs2
fs1
andfs3
fs4
andfs5
fs5
andfs6
fs5
andfs7
fs8
andfs9
fs8
andfs10
用 Python 检查你的答案。
◑ 列出两个包含[A=?x, B=?x]的特征结构。
◑ 忽略结构共享,给出一个统一两个特征结构的非正式算法。
◑ 扩展3.2中的德语语法,使它能处理所谓的动词第二顺位结构,如下所示:
| (58) | | Heute sieht der Hund die Katze. |
◑ 同义动词的句法属性看上去略有不同(Levin, 1993)。思考下面的动词 loaded、filled 和 dumped 的语法模式。你能写语法产生式处理这些数据吗?
| (59) | |
| a. | | The farmer loaded the cart with sand |
| b. | | The farmer loaded sand into the cart |
| c. | | The farmer filled the cart with sand |
| d. | | *The farmer filled sand into the cart |
| e. | | *The farmer dumped the cart with sand |
| f. | | The farmer dumped sand into the cart |
|
★ 形态范例很少是完全正规的,矩阵中的每个单元的意义有不同的实现。例如,词位 walk 的现在时态词性变化只有两种不同形式:第三人称单数的 walks 和所有其他人称和数量的组合的 walk。一个成功的分析不应该额外要求 6 个可能的形态组合中有 5 个有相同的实现。设计和实施一个方法处理这个问题。
★ 所谓的核心特征在父节点和核心孩子节点之间共享。例如,
TENSE
是核心特征,在一个VP
和它的核心孩子V
之间共享。更多细节见(Gazdar, Klein, & and, 1985)。我们看到的结构中大部分是核心结构——除了SUBCAT
和SLASH
。由于核心特征的共享是可以预见的,它不需要在语法产生式中明确表示。开发一种方法自动计算核心结构的这种规则行为的比重。★ 扩展 NLTK 中特征结构的处理,允许统一值为列表的特征,使用这个来实现一个 HPSG 风格的子类别分析,核心类别的
SUBCAT
是它的补语的类别和它直接父母的SUBCAT
值的连结。★ 扩展 NLTK 的特征结构处理,允许带未指定类别的产生式,例如
S[-INV] --> ?x S/?x
。★ 扩展 NLTK 的特征结构处理,允许指定类型的特征结构。
★ 挑选一些(Huddleston & Pullum, 2002)中描述的文法结构,建立一个基于特征的语法计算它们的比例。
关于本文档…
针对 NLTK 3.0 进行更新。本章来自于 Natural Language Processing with Python,Steven Bird, Ewan Klein 和Edward Loper,Copyright © 2014 作者所有。本章依据 Creative Commons Attribution-Noncommercial-No Derivative Works 3.0 United States License [http://creativecommons.org/licenses/by-nc-nd/3.0/us/] 条款,与 自然语言工具包 [http://nltk.org/
] 3.0 版一起发行。
本文档构建于星期三 2015 年 7 月 1 日 12:30:05 AEST