ComposeDataset

class paddle.io. ComposeDataset [源代码]

由多个数据集的字段组成的数据集。

这个数据集用于将多个映射式(map-style)且长度相等数据集按字段组合为一个新的数据集。

参数:

  • datasets (list of Dataset) - 待组合的多个数据集。

返回:Dataset,字段组合后的数据集

代码示例

  1. import numpy as np
  2. import paddle
  3. from paddle.io import Dataset, ComposeDataset
  4. # define a random dataset
  5. class RandomDataset(Dataset):
  6. def __init__(self, num_samples):
  7. self.num_samples = num_samples
  8. def __getitem__(self, idx):
  9. image = np.random.random([32]).astype('float32')
  10. label = np.random.randint(0, 9, (1, )).astype('int64')
  11. return image, label
  12. def __len__(self):
  13. return self.num_samples
  14. dataset = ComposeDataset([RandomDataset(10), RandomDataset(10)])
  15. for i in range(len(dataset)):
  16. image1, label1, image2, label2 = dataset[i]
  17. print(image1)
  18. print(label1)
  19. print(image2)
  20. print(label2)