Pandas 教程

这是许多Pandas教程的指南,主要面向新用户。

官方指南

Pandas自己的 10分钟入门Pandas.

更加复杂的教程在 Cookbook.

比较方便的是 cheat sheet.

pandas 指南

这本由 Julia Evans于2015年编写的pandas指南的目的是为您提供一份入门的具体示例。这些都是真实数据的例子,以及其中所包含的所有bug和奇怪之处。

这是0.2版本的链接。有关最新的内容,请参见pandas-cookbook GitHub repository。要运行本教程中的示例,您需要克隆GitHub仓库并运行IPython记事本。参见如何使用本指南

  • A quick tour of the IPython Notebook: 展示了IPython出色的tab补齐功能和魔术方法。
  • Chapter 1: 将数据读入到Pandas中几乎是最简单的事情。即使编码错误!
  • Chapter 2: 如何从Pandas dataframe中选择数据并不十分明显。在这里,我们将解释基本知识(如何获取切片和列)。
  • Chapter 3: 在这里,我们开始认真地进行切分,并学习如何以非常快的速度以复杂的方式过滤数据流。
  • Chapter 4: Groupby/aggregate是Pandas中我最喜欢的东西,我一直在使用它。你可能应该读一读这篇文章。
  • Chapter 5: 在这里你可以看看蒙特利尔的冬天是不是很冷(剧透:是的)。用Pandas抓取网页很有趣!在这里,我们组合了数据流。
  • Chapter 6: 字符串与Pandas的很友好。它有所有这些向量化的字符串操作都是很棒的。我们将把一组包含“Snow”的字符串转换成数字的向量。
  • Chapter 7: 清理乱七八糟的数据从来都不是一件乐事,但对于Pandas来说更容易。
  • Chapter 8: 解析Unix时间戳一开始令人困惑,但事实证明它非常简单。
  • Chapter 9: 从SQL数据库读取数据。

面向pandas新手的教程

更多资源请访问 repository

  • 01 - Lesson: - 导入库 - 创建数据集 - 创建Data Frames - 从CSV文件读数据 - 导出数据到CSV文件 - 查找最大值 - 绘图
  • 02 - Lesson: - 从TXT文件导入/导出数据 - 获取最前/后面的数据 - 描述性统计 - 数据分组/排序
  • 03 - Lesson: - 创建函数 - 从EXCEL文件导入/导出数据 - 异常值 - Lambda表达式 - 数据切片
  • 04 - Lesson: - 增加/删除列 - 索引操作
  • 05 - Lesson: - Stack/Unstack/Transpose函数
  • 06 - Lesson: - GroupBy函数
  • 07 - Lesson: - 计算异常值的方法
  • 08 - Lesson: - 从Microsoft SQL数据库读取
  • 09 - Lesson: - 导出数据到 CSV/EXCEL/TXT
  • 10 - Lesson: - 在不同格式之间转换
  • 11 - Lesson: - 组合来自不同来源的数据

用Python进行实际数据分析

指南全面介绍了使用python数据生态系统和有趣的开放数据集进行数据分析的过程。共有四个部分涵盖选定的主题,如下所示:

新用户练习

用真实的数据集和练习练习你的技能。有关更多资源,请访问GitHub

比较新的教程

Tom Augspurger于2016年编写的教程. 源代码可以在GitHubTomAugspurger/effective-pandas找到

Excel图表与Pandas, vincent以及xlsxwriter

视频教程

其它各种各样的教程