6.9. 深度循环神经网络

来源:d2l-ai 浏览 969 扫码分享 2019-06-05 22:20:22

6.9. 深度循环神经网络
- 6.9.1. 小结
- 6.9.2. 练习

6.9. 深度循环神经网络

本章到目前为止介绍的循环神经网络只有一个单向的隐藏层，在深度学习应用里，我们通常会用到含有多个隐藏层的循环神经网络，也称作深度循环神经网络。图6.11演示了一个有

个隐藏层的深度循环神经网络，每个隐藏状态不断传递至当前层的下一时间步和当前时间步的下一层。

图 6.11 深度循环神经网络的架构

具体来说，在时间步

里，设小批量输入（样本数为，输入个数为），第隐藏层（）的隐藏状态为（隐藏单元个数为），输出层变量为（输出个数为），且隐藏层的激活函数为。第1隐藏层的隐藏状态和之前的计算一样：

其中权重

、和偏差分别为第1隐藏层的模型参数。

当

时，第隐藏层的隐藏状态的表达式为

其中权重

、和偏差分别为第隐藏层的模型参数。

最终，输出层的输出只需基于第

隐藏层的隐藏状态：

其中权重

和偏差为输出层的模型参数。

同多层感知机一样，隐藏层个数

和隐藏单元个数都是超参数。此外，如果将隐藏状态的计算换成门控循环单元或者长短期记忆的计算，我们可以得到深度门控循环神经网络。

6.9.1. 小结

在深度循环神经网络中，隐藏状态的信息不断传递至当前层的下一时间步和当前时间步的下一层。

6.9.2. 练习

将“循环神经网络的从零开始实现”一节中的模型改为含有2个隐藏层的循环神经网络。观察并分析实验现象。

当前内容版权归 d2l-ai 或其关联方所有，如需对内容或内容相关联开源项目进行关注与资助，请访问 d2l-ai .

本文档使用 BookStack 构建

展开/收起文章目录