1.3 术语
到目前为止,我们只看到像sg
和pl
这样的特征值。这些简单的值通常被称为原子——也就是,它们不能被分解成更小的部分。原子值的一种特殊情况是布尔值,也就是说,值仅仅指定一个属性是真还是假。例如,我们可能要用布尔特征AUX
区分助动词,如 can,may,will 和 do。例如,产生式V[TENSE=pres, AUX=+] -> 'can'
意味着 can 接受TENSE
的值为pres
,并且AUX
的值为+
或true
。有一个广泛采用的约定用缩写表示布尔特征f
;不用AUX=+
或AUX=-
,我们分别用+AUX
和-AUX
。这些都是缩写,然而,分析器就像+
和-
是其他原子值一样解释它们。(15)显示了一些有代表性的产生式:
V[TENSE=pres, +AUX] -> 'can'
V[TENSE=pres, +AUX] -> 'may'
V[TENSE=pres, -AUX] -> 'walks'
V[TENSE=pres, -AUX] -> 'likes'
在传递中,我们应该指出有显示 AVM 的替代方法;1.3显示了一个例子。虽然特征结构呈现的(16)中的风格不太悦目,我们将坚持用这种格式,因为它对应我们将会从 NLTK 得到的输出。
关于表示,我们也注意到特征结构,像字典,对特征的 顺序 没有指定特别的意义。所以(16)等同于︰
[AGR = [NUM = pl ]]
[ [PER = 3 ]]
[ [GND = fem ]]
[ ]
[POS = N ]