Conll05st
class paddle.text.datasets. Conll05st [源代码]
该类是对Conll05st <[https://www.cs.upc.edu/~srlconll/soft.html](https://www.cs.upc.edu/~srlconll/soft.html)>
_ 测试数据集的实现.
注解
只支持自动下载公共的 Conll05st测试数据集。
参数
可设置为None。默认为None。 - word_dict_file(str)- 保存词典的路径。如果参数:attr:download
设置为True, 可设置为None。默认为None。 - verb_dict_file(str)- 保存动词词典的路径。如果参数:attr:
download设置为True, 可设置为None。默认为None。 - target_dict_file(str)- 保存目标词典的路径如果参数:attr:
download设置为True, 可设置为None。默认为None。 - emb_file(str)- 保存词嵌入词典的文件。只有在:code:
get_embedding能被设置为None 且:attr:
download 为True时使用。 - download(bool)- 如果:attr:data_fileword_dict_file
verb_dict_file
和:attr:target_dict_file 未设置,是否下载数据集。默认为True。
返回值
Dataset
,conll05st数据集实例。
代码示例
import paddle
from paddle.text.datasets import Conll05st
class SimpleNet(paddle.nn.Layer):
def __init__(self):
super(SimpleNet, self).__init__()
def forward(self, pred_idx, mark, label):
return paddle.sum(pred_idx), paddle.sum(mark), paddle.sum(label)
conll05st = Conll05st()
for i in range(10):
pred_idx, mark, label= conll05st[i][-3:]
pred_idx = paddle.to_tensor(pred_idx)
mark = paddle.to_tensor(mark)
label = paddle.to_tensor(label)
model = SimpleNet()
pred_idx, mark, label= model(pred_idx, mark, label)
print(pred_idx.numpy(), mark.numpy(), label.numpy())