MaxPool3D
paddle.nn. MaxPool3D ( kernel_size, stride=None, padding=0, ceil_mode=False, return_mask=False, data_format=’NCDHW’, name=None ) [源代码]
该接口用于构建 MaxPool3D 类的一个可调用对象,其将构建一个二维最大池化层,根据输入参数 kernel_size, stride, padding 等参数对输入做最大池化操作。
例如:
输入:
X 形状:
属性:
kernel_size:
stride:
输出:
Out 形状:(N,C,Dout,Hout,Wout)(N,C,Dout,Hout,Wout)
..math::out(Ni,Cj,d,h,w)=maxk=0,…,kD−1maxm=0,…,kH−1maxn=0,…,kW−1input(Ni,Cj,stride[0]×d+k,stride[1]×h+m,stride[2]×w+n)..math::out(Ni,Cj,d,h,w)=maxk=0,…,kD−1maxm=0,…,kH−1maxn=0,…,kW−1input(Ni,Cj,stride[0]×d+k,stride[1]×h+m,stride[2]×w+n)
参数
kernel_size (int|list|tuple): 池化核大小。如果它是一个元组或列表,它必须包含三个整数值, (pool_size_Depth,pool_size_Height, pool_size_Width)。若为一个整数,则表示D,H和W维度上均为该值,比如若pool_size=2, 则池化核大小为[2,2,2]。
stride (int|list|tuple,可选):池化层的步长。如果它是一个元组或列表,它将包含三个整数,(pool_stride_Depth,pool_stride_Height, pool_stride_Width)。若为一个整数,则表示D, H和W维度上stride均为该值。默认值为None, 这时会使用kernel_size作为stride。
padding (str|int|list|tuple,可选) 池化填充。如果它是一个字符串,可以是”VALID”或者”SAME”,表示填充算法。如果它是一个元组或列表,它可以有3种格式:(1)包含3个整数值:[pad_depth, pad_height, pad_width];(2)包含6个整数值:[pad_depth_front, pad_depth_back, pad_height_top, pad_height_bottom, pad_width_left, pad_width_right];(3)包含5个二元组:当 data_format 为”NCDHW”时为[[0,0], [0,0], [pad_depth_front, pad_depth_back], [pad_height_top, pad_height_bottom], [pad_width_left, pad_width_right]],当 data_format 为”NDHWC”时为[[0,0], [pad_depth_front, pad_depth_back], [pad_height_top, pad_height_bottom], [pad_width_left, pad_width_right], [0,0]]。若为一个整数,则表示D、H和W维度上均为该值。默认值:0
ceil_mode (bool,可选):是否用ceil函数计算输出高度和宽度。如果是True,则使用 ceil 计算输出形状的大小。默认为False
return_mask (bool,可选):是否返回最大索引和输出。默认为False.
data_format (str,可选): 输入和输出的数据格式,可以是”NCDHW”和”NDHWC”。N是批尺寸,C是通道数,D是特征深度,H是特征高度,W是特征宽度。默认值:”NDCHW”。
name (str,可选):函数的名字,默认为None.
形状
x (Tensor): 默认形状为(批大小,通道数,长度,高度,宽度),即NCDHW格式的5-D Tensor。 其数据类型为float16, float32, float64, int32或int64.
output (Tensor): 默认形状为(批大小,通道数,输出特征长度,输出特征高度,输出特征宽度),即NCDHW格式的5-D Tensor。 其数据类型与输入相同。
返回
计算MaxPool3D的可调用对象
代码示例
import paddle
import paddle.nn as nn
import numpy as np
# max pool3d
input = paddle.uniform(shape=[1, 2, 3, 32, 32], dtype='float32', min=-1, max=1)
MaxPool3D = nn.MaxPool3D(kernel_size=2,
stride=2, padding=0)
output = MaxPool3D(input)
# output.shape [1, 2, 3, 16, 16]
# for return_mask=True
MaxPool3D = nn.MaxPool3D(kernel_size=2,stride=2, padding=0, return_mask=True)
output, max_indices = MaxPool3D(input)
# output.shape [1, 2, 3, 16, 16], max_indices.shape [1, 2, 3, 16, 16],