数据可视化
数据可视化简单的说就是将数据呈现为漂亮的统计图表,然后进一步发现数据中包含的规律以及隐藏的信息。之前的课程,我们已经为大家展示了Python在数据处理方面的优势,为大家介绍了NumPy和Pandas的应用,以此为基础,我们可以进一步使用Matplotlib和Seaborn来实现数据的可视化,将数据处理的结果展示为直观的可视化图表。
Matplotlib的应用
安装和导入
对于使用Anaconda的用户,在安装Anaconda时已经携带了数据分析和可视化的库,无需再单独安装Matplotlib。如果没有安装Anaconda但是有Python环境,可以使用Python的包管理工具pip来安装,命令如下所示。
pip install matplotlib
接下来,我们在Jupyter Notebook中用下面的方式导入Matplotlib。
from matplotlib import pyplot as plt
通过下面的魔法指令,可以让创建的图表直接内嵌在浏览器窗口中显示。
%matplotlib inline
通过下面的魔法指令,可以生成矢量图(SVG)。
%config InlineBackend.figure_format='svg'
绘图的流程
- 创建画布
- 绘制图像
- 显示(保存)图像
绘制的例子
运行程序,效果如下图所示。
解决中文显示问题
定制图表效果
图形的种类和意义
- 绘制散点图
- 绘制柱状图
- 绘制直方图
- 绘制饼图