第2天-爬虫入门之基础篇 XML 示例 HTML DOM 示例 第2天-爬虫入门之基础篇 数据格式 描述 设计目标 XML Extensible Markup Language (可扩展标记语言) 被设计为传输和存储数据,其焦点是数据的内容 HTML HyperText Markup Language(超文本标记语言) 显示数据以及如何更好显示数...
第1天-爬虫入门初级篇 IDE 选择 装python2还是python3 Windows 平台 Linux Ubuntu 平台 第1天-爬虫入门初级篇 IDE 选择 PyCharm Sublime Text 2 VS2015 装python2还是python3 python目前有2个版本,python2和python3. 为啥...
HTML 处理 处理 HTML 和 XML 的库。 BeautifulSoup:以 Python 风格的方式来对 HTML 或 XML 进行迭代,搜索和修改。官网 bleach:一个基于白名单的 HTML 清理和文本链接库。官网 cssutils:一个 Python 的 CSS 库。官网 html5lib:一个兼容标准的 HTML 文档和片段解...