Decoder

Decoder是dynamic_decode中使用的任何decoder实例的基类。它提供了为每一个时间步生成输出的接口,可用于生成序列。

Decoder提供的主要抽象为:

  1. (initial_input, initial_state, finished) = initialize(inits), 为第一个解码步生成输入和状态,并给出指示batch中的每个序列是否结束的初始标识。

  2. (output, next_state, next_input, finished) = step(time, input, state), 将输入和状态转换为输出和新的状态,为下一个解码步生成输入,并给出指示batch中的每个序列是否结束的标识。

  3. (final_outputs, final_state) = finalize(outputs, final_state, sequence_lengths), 修改输出(所有时间步输出的堆叠)和最后的状态以做特殊用途。若无需修改堆叠得到的输出和来自最后一个时间步的状态,则无需实现。

与RNNCell相比,Decoder更为通用,因为返回的 next_inputfinished 使它可以自行决定输入以及结束时机。

  • initialize(inits)

在解码迭代之前调用一次。

  • 参数:
    • inits - 调用方提供的参数。

返回:一个元组 (initial_inputs, initial_states, finished)initial_inputsinitial_states 都是单个tensor变量或tensor变量组成的嵌套结构, finished 是具有bool数据类型的tensor。

返回类型:tuple

  • step(time, inputs, states)

在解码的每个时间步中被调用的接口

  • 参数:
    • outputs (Variable) - 单个tensor变量或tensor变量组成的嵌套结构。 结构和数据类型与 output_dtype 相同。 tensor堆叠所有时间步长的输出从而具有shape Decoder - 图1 ,由调用者完成。
    • final_states (Variable) - 单个tensor变量或tensor变量组成的嵌套结构。 它是 decoder.step 在最后一个解码步返回的 next_states, 因此具有与任何时间步长的状态相同的结构,形状和数据类型。

返回:一个元组 (final_outputs, final_states)final_outputsfinal_states 都是单个tensor变量或tensor变量组成的嵌套结构。

返回类型:tuple