beam_search_decode
paddle.fluid.layers. beam_search_decode ( ids, scores, beam_size, end_id, name=None ) [源代码]
该OP用在整个束搜索(Beam search)结束后,通过沿 ids
中保存的搜索路径回溯,为每个源句(样本)构造完整的beam search结果序列并保存在LoDTensor中。LoDTensor的格式和解析方式如下:
若 lod = [[0, 3, 6], [0, 12, 24, 40, 54, 67, 82]]
从第一层LoD的内容可以得出:包含两个样本,每个样本均对应了3个(等于束的宽度)生成序列
从第二层LoD的内容可以得出:第一个样本对应的三个序列的长度分别为12, 12, 16,第一个样本对应的三个序列的长度分别为14, 13, 15。
完整用法请参阅下面的使用示例:
fluid/tests/book/test_machine_translation.py
参数:
id (Variable) - 保存了每个时间步选择的id(beam_search OP的输出)的LoDTensorArray。其中每个LoDTensor的数据类型为int64,LoD level为2,LoD中保存了搜索路径信息。
score (Variable) - 保存了每个时间步选择的id所对应累积得分(beam_search OP的输出)的LoDTensorArray,和
id
具有相同大小。其中每个LoDTensor要和id
中相应LoDTensor具有相同的形状和LoD,表示其对应的累积得分。数据类型为float32。beam_size (int) - 指示束搜索中波束的宽度。
end_id (int) - 指明标识序列结束的id。
name (str,可选) – 具体用法请参见 Name ,一般无需设置,默认值为None。
返回: Variable的二元组, 包含了完整id序列和对应的累积得分两个LodTensor,数据类型分别为int64和float32,形状相同且均展开为1维,LoD相同且level均为2。根据两层LoD可分别得到每个源句(样本)有多少个生成序列和每个序列有多少个id。
返回类型: tuple
代码示例
import paddle.fluid as fluid
# 假设 `ids` 和 `scores` 为LoDTensorArray类型的Variable,它们保留了
# 所有时间步选择出的id和score
ids = fluid.layers.create_array(dtype='int64')
scores = fluid.layers.create_array(dtype='float32')
finished_ids, finished_scores = fluid.layers.beam_search_decode(
ids, scores, beam_size=5, end_id=0)