数据输入输出
数据输入
Fluid支持两种数据输入方式,包括:
Python Reader: 纯Python的Reader。用户在Python端定义
fluid.layers.data
层构建网络,并通过executor.run(feed=…)
的方式读入数据。数据读取和模型训练/预测的过程是同步进行的。PyReader: 高效灵活的C++ Reader接口。PyReader内部维护容量为
capacity
的队列(队列容量由fluid.layers.py_reader
接口中的capacity
参数设置),Python端调用队列的push
方法送入训练/预测数据,C++端的训练/预测程序调用队列的pop
方法取出Python端送入的数据。PyReader可与double_buffer
配合使用,实现数据读取和训练/预测的异步执行。
具体使用方法请参考 py_reader。
数据输出
Fluid支持在训练/预测阶段获取当前batch的数据。
用户可通过 executor.run(fetch_list=[…], return_numpy=…)
的方式 fetch期望的输出变量,通过设置 return_numpy
参数设置是否将输出数据转为numpy array。 若 return_numpy
为 False
,则返回 LoDTensor
类型数据。
具体使用方式请参考相关API文档 Executor 和 ParallelExecutor。