lstm_unit
paddle.fluid.layers.lstm_unit
( x_t, hidden_t_prev, cell_t_prev, forget_bias\=0.0, param_attr\=None, bias_attr\=None, name\=None ) [源代码]
Long-Short Term Memory(LSTM)循环神经网络计算单元。该OP用于完成单个时间步内LSTM的计算,基于论文 RECURRENT NEURAL NETWORK REGULARIZATION 中的描述实现,
并在forget gate(遗忘门)中增加了 forget_bias
来控制遗忘力度,公式如下:
其中,
对应 x_t
, 表示当前时间步的输入;
和
对应 hidden_t_prev
和 cell_t_prev
,表示上一时间步的hidden和cell输出;
分别为input gate(输入门)、forget gate(遗忘门)、cell、output gate(输出门)和hidden的计算。
参数:
x_t (Variable) - 表示当前时间步的输入的Tensor,形状为
,其中
为batch_size, MM 为输入的特征维度大小。数据类型为float32或float64。
hidden_t_prev (Variable) - 表示前一时间步hidden输出的Tensor,形状为 [N,D][N,D],其中 NN 为batch_size, DD 为LSTM中隐单元的数目。数据类型与
x_t
相同。cell_t_prev (Variable) - 表示前一时间步cell输出的Tensor,和
hidden_t_prev
具有相同形状和数据类型。forget_bias (float,可选) - 额外添加在遗忘门中的偏置项(参见公式)。默认值为0。
param_attr (ParamAttr,可选) – 指定权重参数属性的对象。默认值为None,表示使用默认的权重参数属性。具体用法请参见 ParamAttr 。
bias_attr (ParamAttr,可选) - 指定偏置参数属性的对象。默认值为None,表示使用默认的偏置参数属性。具体用法请参见 ParamAttr 。
name (str,可选) – 具体用法请参见 Name ,一般无需设置,默认值为None。
返回:Variable的二元组,包含了两个形状和数据类型均与 hidden_t_prev
相同的Tensor,分别表示hiddel和cell输出,即公式中的 htht 和 ctct 。
返回类型:tuple
抛出异常:
ValueError
:x_t
的阶不为2ValueError
:hidden_t_prev
的阶不为2ValueError
:cell_t_prev
的阶不为2ValueError
:x_t
、hidden_t_prev
和cell_t_prev
的第一维大小必须相同ValueError
:hidden_t_prev
和cell_t_prev
的第二维大小必须相同
代码示例:
import paddle.fluid as fluid
dict_dim, emb_dim, hidden_dim = 128, 64, 512
data = fluid.data(name='step_data', shape=[None], dtype='int64')
x = fluid.embedding(input=data, size=[dict_dim, emb_dim])
pre_hidden = fluid.data(
name='pre_hidden', shape=[None, hidden_dim], dtype='float32')
pre_cell = fluid.data(
name='pre_cell', shape=[None, hidden_dim], dtype='float32')
hidden = fluid.layers.lstm_unit(
x_t=x,
hidden_t_prev=pre_hidden,
cell_t_prev=pre_cell)