运行提交参数

在XLearning客户端,使用$XLEARNING_HOME/bin/xl-submit命令,将作业提交至Yarn集群进行调度执行。提交命令使用说明请见README运行示例部分,详细提交参数说明如下:

参数名称含义
app-name指定作业名称
app-type指定作业类型,默认为XLearning,可根据使用深度学习平台设置为TensorFlow、Caffe、XGBoost等
input输入文件路径,格式为 HDFS路径#本地文件夹名称
output输出文件路径,格式为 HDFS路径#本地文件夹名称
files指定作业执行所需本地文件
cacheArchive指定作业执行所需相关HDFS压缩文件
cacheFile指定作业执行所需相关HDFS文件
launch-cmd作业执行命令
user-path用户追加环境变量$PATH
jars指定用户自定义jar包文件
user-classpath-first是否优先加载用户自定义jar包,默认为系统配置xlearning.user.classpath.first
conf设置系统配置
am-cores指定AM申请使用的CPU核数,默认个数为系统配置xlearning.am.cores
am-memory指定AM申请使用的内存大小,默认单位MB,默认大小为系统配置xlearning.am.memory
ps-num指定ps申请数目,默认个数为系统配置xlearning.ps.num
ps-cores指定ps申请的CPU核数,默认个数为系统配置xlearning.ps.cores
ps-memory指定ps申请的内存大小,默认单位为MB,默认大小为系统配置xlearning.ps.memory
worker-num指定worker申请数目,默认个数为系统配置xlearning.worker.num
worker-cores指定worker申请的CPU核数,默认个数为系统配置xlearning.worker.cores
worker-memory指定worker申请内存,默认单位为MB,默认大小为系统配置xlearning.worker.memory
chiefworker-memory指定chief worker申请内存, 主要是针对TensorFlow作业中index 0的worker,默认大小同worker-memory一致
evaluatorworker-memory指定evaluator worker申请内存,主要针对TensorFlow Estimator作业中的estimator角色,默认大小同worker-memory一致
queue指定作业提交队列,默认为系统配置xlearning.app.queue
priority指定作业提交优先级,默认为系统配置xlearning.app.priority对应级别
board-enable是否开启Board服务,默认为系统配置xlearning.tf.board.enable
board-index指定开启Board服务的work index,默认为系统配置xlearning.tf.board.worker.index
board-logdirBoard日志存放路径,默认为系统配置xlearning.tf.board.log.dir
board-reloadintervalTensorBoard数据加载时间间隔,默认为系统配置xlearning.tf.board.reload.interval
board-historydirBoard日志HDFS上传路径,默认为系统配置xlearning.tf.board.history.dir
board-modelpbVisualDL加载的模型文件,默认为系统配置xlearning.board.modelpb
board-cacheTimeoutVisualDL加载缓存间隔时间,默认为系统配置xlearning.board.cache.timeout
input-strategy输入文件加载策略,默认为系统配置xlearning.input.strategy
inRenameInputFile当输入文件加载策略为DOWNLOAD时,设置是否对下载后的文件进行重命名,默认为系统配置xlearning.inputfile.rename
stream-epoch当输入文件加载策略为STREAM时,流式数据读取次数,默认为系统配置xlearning.stream.epoch
inputformat当输入文件加载策略为STREAM时,指定inputformat类,默认为系统配置xlearning.inputformat.class
inputformat-shuffle当输入文件加载策略为STREAM时,指定inputformat输入是否需要shuffle操作,默认为系统配置xlearning.input.stream.shuffle
output-strategy输出文件加载策略,默认为系统配置xlearning.output.strategy
outputformat当输出文件加载模式为STREAM时,指定outputformat类,默认为系统配置xlearning.outputformat.class
tf-evaluator在分布式TensorFlow作业类型下,是否设置evaluator角色,默认为系统配置xlearning.tf.evaluator
output-index指定保存index对应worker的输出文件,默认保存所有worker的输出结果