数据输入输出

数据输入

Fluid支持两种数据输入方式,包括:

  1. Python Reader: 纯Python的Reader。用户在Python端定义 fluid.layers.data 层构建网络,并通过 executor.run(feed=…) 的方式读入数据。数据读取和模型训练/预测的过程是同步进行的。

  2. PyReader: 高效灵活的C++ Reader接口。PyReader内部维护容量为 capacity 的队列(队列容量由 fluid.layers.py_reader 接口中的 capacity 参数设置),Python端调用队列的 push 方法送入训练/预测数据,C++端的训练/预测程序调用队列的 pop 方法取出Python端送入的数据。PyReader可与 double_buffer 配合使用,实现数据读取和训练/预测的异步执行。

具体使用方法请参考 py_reader

数据输出

Fluid支持在训练/预测阶段获取当前batch的数据。

用户可通过 executor.run(fetch_list=[…], return_numpy=…) 的方式 fetch期望的输出变量,通过设置 return_numpy 参数设置是否将输出数据转为numpy array。 若 return_numpyFalse ,则返回 LoDTensor 类型数据。

具体使用方式请参考相关API文档 ExecutorParallelExecutor