结构化标记处理工具
Python 支持各种模块,以处理各种形式的结构化数据标记。 这包括使用标准通用标记语言(SGML)和超文本标记语言(HTML)的模块,以及使用可扩展标记语言(XML)的几个接口。
- html —- 超文本标记语言支持
- html.parser —- 简单的 HTML 和 XHTML 解析器
- html.entities —- HTML 一般实体的定义
- XML处理模块
- xml.etree.ElementTree —- ElementTree XML API
- xml.dom —- 文档对象模型 API
- xml.dom.minidom —- 最小化的 DOM 实现
- xml.dom.pulldom —- 支持构建部分 DOM 树
- xml.sax —- 支持 SAX2 解析器
- xml.sax.handler —- SAX 处理句柄的基类
- xml.sax.saxutils —- SAX 工具集
- xml.sax.xmlreader —- 用于 XML 解析器的接口
- xml.parsers.expat —- 使用 Expat 的快速 XML 解析