介绍
VisualDL是一个面向深度学习任务设计的可视化工具,包含了scalar、参数分布、模型结构、图像可视化等功能,项目正处于高速迭代中,新的组件会不断加入。
目前大多数DNN平台均使用Python作为配置语言,VisualDL原生支持python的使用,通过在模型的Python配置中添加几行,便可以为训练过程提供丰富的可视化支持。
除了Python SDK之外,VisualDL底层采用C++编写,其暴露的C++ SDK也可以集成到其他平台中,实现原生的性能和定制效果。
我为什么要用 VisualDL?
Visual DL有以下几方面的优点。
可视化
目前大部分深度学习框架都是基于Python语言,训练过程的状态通过日志的方式记录下来,这种方式可以短期看一下训练状态,但是很难从全局把握训练过程的一些变化趋势,提取的信息有限。
Visual DL 让你方便的将训练过程可视化起来,形成类似下面的图片:
易集成
Visual DL提供独立的Python SDK,如果训练任务是基于Python的话,直接安装visualdl的whl包,import到自己项目中即可使用。详情请参阅安装。
易使用
- 在自己的Python代码中加入visualdl记日志的逻辑。
- import visualdl
- log_writer = LogWriter("./log", sync_cycle=30)
- with log_writer.mode('train') as logger:
- loss_writer = logger.scalar("loss")
- for step in steps:
- loss = train_process()
- loss_writer.add_record(step, loss)
- 启动visualdl service即可通过浏览器查看日志的可视化结果。
- visualdl --logdir ./log --model_pb <path_to_onnx_model> # onnx model and port are optional
功能全
Scalar. 支持Scalar打点数据展示,如上图所示:
- 可以将训练过程中的loss,准确率等信息以折现的形式体现出来,方便看出整体趋势。
- 可以在同一个图片中画出多条曲线,方便对比分析。
Image. 支持图片展示。
输入图片展示,方便查看数据样本的质量
支持卷积层的结果展示,方便查看卷积之后的效果。
- 支持图像生成任务生成图片的预览。
Audio. 支持播放音频样本。
- 输入音频或生成音频展示,让用户播放或下载
- 针对于语音识别和语音合成模型的训练
- 方便查看数据样本的质量或调查问题
Histogram. 参数分布展示,方便查看参数矩阵中数值的分布曲线,以及随着训练的进行,参数数值分布的变化趋势。
帮助用户理解训练过程,随着训练的进行,参数从一种分布变化到另外一种分布,背后对应的原因。
方便用户判断训练是否正常,例如参数迅速变小到0或者迅速变大,说明有梯度消失或者梯度爆炸的问题。
Graph. 方便查看深度神经网络的模型结构。
Graph支持直接对ONNX的模型进行预览,因为MXNet,Caffe2,Pytorch和CNTK都支持转成ONNX的模型,也就间接支持了这些框架的模型可视化功能。
便于排查网络配置的错误
帮助理解网络结构
High Dimensional: 用高维度数据映射在2D/3D来可视化嵌入
便于了解不同物件(文字,图片)的相似度,相关性
把物件嵌入到向量空间来可视化邻居距离和聚集
支持降维算法像PCA, T-SNE
从以下图片(
vdl_create_log
例子生成)能看出’man’ and ‘women’, ‘king’ and ‘queen’的相似性
- 这是在3D图的效果
完全开放
Visual DL作为一个深度学习任务可视化工具,同时支持所有的深度学习框架。SDK层面可以方便的集成到Python或者C++项目中,Graph通过支持ONNX支持了PaddlePaddle、MxNet、PyTorch和Caffe2等流行的深度学习框架。
欢迎大家一起来改进,让工具变得更好用,提高大家的工作效率。