结构化标记处理工具
Python 支持各种模块,以处理各种形式的结构化数据标记。 这包括使用标准通用标记语言(SGML)和超文本标记语言(HTML)的模块,以及使用可扩展标记语言(XML)的几个接口。
html
—- 超文本标记语言支持html.parser
—- 简单的 HTML 和 XHTML 解析器html.entities
—- HTML 一般实体的定义- XML处理模块
xml.etree.ElementTree
—- ElementTree XML APIxml.dom
—- The Document Object Model APIxml.dom.minidom
—- Minimal DOM implementationxml.dom.pulldom
—- Support for building partial DOM treesxml.sax
—- Support for SAX2 parsersxml.sax.handler
—- Base classes for SAX handlersxml.sax.saxutils
—- SAX 工具集xml.sax.xmlreader
—- Interface for XML parsersxml.parsers.expat
—- Fast XML parsing using Expat