选项列表

调用不带参数的命令来列出可用参数及其默认值:

  1. $ ./fasttext supervised
  2. 空的输入或输出路径.
  3. 以下参数是强制性的:
  4. -input 训练文件路径
  5. -output 输出文件路径
  6. 以下参数是可选的:
  7. -verbose 冗长等级 [2]
  8. 以下字典参数是可选的:
  9. -minCount 词出现的最少次数 [5]
  10. -minCountLabel 标签出现的最少次数 [0]
  11. -wordNgrams 单词 ngram 的最大长度 [1]
  12. -bucket 桶的个数 [2000000]
  13. -minn char ngram 的最小长度 [3]
  14. -maxn char ngram 的最大长度 [6]
  15. -t 抽样阈值 [0.0001]
  16. -label 标签前缀 [__label__]
  17. 以下用于训练的参数是可选的:
  18. -lr 学习速率 [0.05]
  19. -lrUpdateRate 更改学习速率的更新速率 100]
  20. -dim 字向量的大小 [100]
  21. -ws 上下文窗口的大小 [5]
  22. -epoch 迭代次数 [5]
  23. -neg 负样本个数 [5]
  24. -loss 损失函数 {ns, hs, softmax} [ns]
  25. -thread 线程个数 [12]
  26. -pretrainedVectors 监督学习的预训练词向量 []
  27. -saveOutput 是否应该保存输出参数 [0]
  28. 以下量化参数是可选的:
  29. -cutoff 要保留的词和 ngram 的数量 [0]
  30. -retrain 微调 embeddings(假如应用 -cutoff 参数的话) [0]
  31. -qnorm 分别量化范数 [0]
  32. -qout 量化分类器 [0]
  33. -dsub 每个子向量的大小 [2]

默认值可能因模式而异。 (Word-representation 模型 skipgramcbow 使用 5 作为 -minCount 的默认值)