5 命名实体识别

在本章开头,我们简要介绍了命名实体(NE)。命名实体是确切的名词短语,指示特定类型的个体,如组织、人、日期等。5.1列出了一些较常用的 NE 类型。这些应该是不言自明的,除了“FACILITY”:建筑和土木工程领域的人造产品;以及“GPE”:地缘政治实体,如城市、州/省、国家。

表 5.1:

常用命名实体类型

  1. Eddy N B-PER
  2. Bonte N I-PER
  3. is V O
  4. woordvoerder N O
  5. van Prep O
  6. diezelfde Pron O
  7. Hogeschool N B-ORG
  8. . Punc O
  1. >>> print(nltk.ne_chunk(sent))
  2. (S
  3. The/DT
  4. (GPE U.S./NNP)
  5. is/VBZ
  6. one/CD
  7. ...
  8. according/VBG
  9. to/TO
  10. (PERSON Brooke/NNP T./NNP Mossman/NNP)
  11. ...)