Conll05st

class paddle.text.datasets. Conll05st [源代码]

该类是对Conll05st <[https://www.cs.upc.edu/~srlconll/soft.html](https://www.cs.upc.edu/~srlconll/soft.html)>_ 测试数据集的实现.

注解

只支持自动下载公共的 Conll05st测试数据集。

参数

  • data_file(str)- 保存数据的路径,如果参数:attr:download设置为True,

可设置为None。默认为None。 - word_dict_file(str)- 保存词典的路径。如果参数:attr:download设置为True, 可设置为None。默认为None。 - verb_dict_file(str)- 保存动词词典的路径。如果参数:attr:download设置为True, 可设置为None。默认为None。 - target_dict_file(str)- 保存目标词典的路径如果参数:attr:download设置为True, 可设置为None。默认为None。 - emb_file(str)- 保存词嵌入词典的文件。只有在:code:get_embedding能被设置为None 且:attr:download 为True时使用。 - download(bool)- 如果:attr:data_file word_dict_file verb_dict_file 和:attr:target_dict_file 未设置,是否下载数据集。默认为True。

返回值

Dataset,conll05st数据集实例。

代码示例

  1. import paddle
  2. from paddle.text.datasets import Conll05st
  3. class SimpleNet(paddle.nn.Layer):
  4. def __init__(self):
  5. super(SimpleNet, self).__init__()
  6. def forward(self, pred_idx, mark, label):
  7. return paddle.sum(pred_idx), paddle.sum(mark), paddle.sum(label)
  8. conll05st = Conll05st()
  9. for i in range(10):
  10. pred_idx, mark, label= conll05st[i][-3:]
  11. pred_idx = paddle.to_tensor(pred_idx)
  12. mark = paddle.to_tensor(mark)
  13. label = paddle.to_tensor(label)
  14. model = SimpleNet()
  15. pred_idx, mark, label= model(pred_idx, mark, label)
  16. print(pred_idx.numpy(), mark.numpy(), label.numpy())