Pandas 教程
这是许多Pandas教程的指南,主要面向新用户。
官方指南
Pandas自己的 10分钟入门Pandas.
更加复杂的教程在 Cookbook.
比较方便的是 cheat sheet.
pandas 指南
这本由 Julia Evans于2015年编写的pandas指南的目的是为您提供一份入门的具体示例。这些都是真实数据的例子,以及其中所包含的所有bug和奇怪之处。
这是0.2版本的链接。有关最新的内容,请参见pandas-cookbook GitHub repository。要运行本教程中的示例,您需要克隆GitHub仓库并运行IPython记事本。参见如何使用本指南。
- A quick tour of the IPython Notebook: 展示了IPython出色的tab补齐功能和魔术方法。
- Chapter 1: 将数据读入到Pandas中几乎是最简单的事情。即使编码错误!
- Chapter 2: 如何从Pandas dataframe中选择数据并不十分明显。在这里,我们将解释基本知识(如何获取切片和列)。
- Chapter 3: 在这里,我们开始认真地进行切分,并学习如何以非常快的速度以复杂的方式过滤数据流。
- Chapter 4: Groupby/aggregate是Pandas中我最喜欢的东西,我一直在使用它。你可能应该读一读这篇文章。
- Chapter 5: 在这里你可以看看蒙特利尔的冬天是不是很冷(剧透:是的)。用Pandas抓取网页很有趣!在这里,我们组合了数据流。
- Chapter 6: 字符串与Pandas的很友好。它有所有这些向量化的字符串操作都是很棒的。我们将把一组包含“Snow”的字符串转换成数字的向量。
- Chapter 7: 清理乱七八糟的数据从来都不是一件乐事,但对于Pandas来说更容易。
- Chapter 8: 解析Unix时间戳一开始令人困惑,但事实证明它非常简单。
- Chapter 9: 从SQL数据库读取数据。
面向pandas新手的教程
更多资源请访问 repository。
- 01 - Lesson: - 导入库 - 创建数据集 - 创建Data Frames - 从CSV文件读数据 - 导出数据到CSV文件 - 查找最大值 - 绘图
- 02 - Lesson: - 从TXT文件导入/导出数据 - 获取最前/后面的数据 - 描述性统计 - 数据分组/排序
- 03 - Lesson: - 创建函数 - 从EXCEL文件导入/导出数据 - 异常值 - Lambda表达式 - 数据切片
- 04 - Lesson: - 增加/删除列 - 索引操作
- 05 - Lesson: - Stack/Unstack/Transpose函数
- 06 - Lesson: - GroupBy函数
- 07 - Lesson: - 计算异常值的方法
- 08 - Lesson: - 从Microsoft SQL数据库读取
- 09 - Lesson: - 导出数据到 CSV/EXCEL/TXT
- 10 - Lesson: - 在不同格式之间转换
- 11 - Lesson: - 组合来自不同来源的数据
用Python进行实际数据分析
本指南全面介绍了使用python数据生态系统和有趣的开放数据集进行数据分析的过程。共有四个部分涵盖选定的主题,如下所示:
新用户练习
用真实的数据集和练习练习你的技能。有关更多资源,请访问GitHub。
- 01 - 获取和了你的数据
- 02 - 过滤和排序
- 03 - 分组
- 04 - Apply
- 05 - 合并
- 06 - 统计
- 07 - 可视化
- 08 - 创建Series 和 DataFrames
- 09 - 时间序列
- 10 - 删除
比较新的教程
由Tom Augspurger于2016年编写的教程. 源代码可以在GitHubTomAugspurger/effective-pandas找到
Excel图表与Pandas, vincent以及xlsxwriter
视频教程
- 从头开始学Pandas (2015) (2:24) GitHub repo
- Pandas简介 (2016) (1:28) GitHub repo
- Pandas: .head() to .tail() (2016) (1:26) GitHub repo
其它各种各样的教程
- Wes McKinney’s (pandas BDFL) blog
- Statistical analysis made easy in Python with SciPy and pandas DataFrames, by Randal Olson
- Statistical Data Analysis in Python, tutorial videos, by Christopher Fonnesbeck from SciPy 2013
- Financial analysis in Python, by Thomas Wiecki
- Intro to pandas data structures, by Greg Reda
- Pandas and Python: Top 10, by Manish Amde
- Pandas Tutorial, by Mikhail Semeniuk
- Pandas DataFrames Tutorial, by Karlijn Willems
- A concise tutorial with real life examples