20. 结构化标记处理工具
Python 支持各种模块,以处理各种形式的结构化数据标记。 这包括使用标准通用标记语言(SGML)和超文本标记语言(HTML)的模块,以及使用可扩展标记语言(XML)的几个接口。
- 20.1. html — 超文本标记语言支持
- 20.2. html.parser — 简单的 HTML 和 XHTML 解析器
- 20.3. html.entities — HTML 一般实体的定义
- 20.4. XML处理模块
- 20.5. xml.etree.ElementTree — ElementTree XML API
- 20.6. xml.dom — 文档对象模型 API
- 20.7. xml.dom.minidom — 最小化的 DOM 实现
- 20.8. xml.dom.pulldom — 支持构建部分 DOM 树
- 20.9. xml.sax — 支持 SAX2 解析器
- 20.10. xml.sax.handler — SAX 处理程序的基类
- 20.11. xml.sax.saxutils — SAX 工具集
- 20.12. xml.sax.xmlreader — 用于 XML 解析器的接口
- 20.13. xml.parsers.expat — 使用 Expat 的快速 XML 解析