prroi_pool

prroi_pool

paddle.fluid.layers.prroi_pool(input, rois, output_channels, spatial_scale, pooled_height, pooled_width, name=None)[源代码]

PRROIPool运算

精确区域池化方法（Precise region of interest pooling，也称为PRROIPooling）是对输入的 “感兴趣区域”(RoI)执行插值处理，将离散的特征图数据映射到一个连续空间，使用二重积分再求均值的方式实现Pooling。

通过积分方式计算ROI特征，反向传播时基于连续输入值计算梯度，使得反向传播连续可导的PRROIPooling。有关更多详细信息，请参阅 https://arxiv.org/abs/1807.11590。

参数

input （Variable） - （Tensor），PRROIPoolOp的输入。输入张量的格式是NCHW。其中N是批大小batch_size，C是输入通道的数量，H是输入特征图的高度，W是特征图宽度
rois （Variable） - 要进行池化的RoI（感兴趣区域）。应为一个形状为(num_rois, 4)的二维LoDTensor，其lod level为1。给出[[x1, y1, x2, y2], …]，(x1, y1)为左上角坐标，(x2, y2)为右下角坐标。
output_channels （integer） - （int），输出特征图的通道数。对于共C个种类的对象分类任务，output_channels应该是（C + 1），该情况仅适用于分类任务。
spatial_scale （float） - （float，default 1.0），乘法空间比例因子，用于将ROI坐标从其输入比例转换为池化使用的比例。默认值：1.0
pooled_height （integer） - （int，默认值1），池化输出的高度。默认值：1
pooled_width （integer） - （int，默认值1），池化输出的宽度。默认值：1
name （str，default None） - 此层的名称。

（Tensor），PRROIPoolOp的输出是形为 (num_rois，output_channels，pooled_h，pooled_w) 的4-D Tensor。

返回类型

变量（Variable）

代码示例

import paddle.fluid as fluid
x = fluid.layers.data(name='x', shape=[490, 28, 28], dtype='float32')
rois = fluid.layers.data(name='rois', shape=[4], lod_level=1, dtype='float32')
pool_out = fluid.layers.prroi_pool(x, rois, 10, 1.0, 7, 7)