sentiment
脚本获取并预处理由NLTK提供的movie_reviews数据集。
paddle.dataset.sentiment.
get_word_dict
()[源代码]
按照样本中出现的单词的频率对单词进行排序。
返回: words_freq_sorted
paddle.dataset.sentiment.
train
()[源代码]
默认的训练集reader creator。
paddle.dataset.sentiment.
test
()[源代码]
默认的测试集reader creator。
paddle.dataset.sentiment.
convert
(path)
将数据集转换为recordio格式。