架构设计

architecture

XLearning系统包括三种组件:

  • Client:XLearning客户端,负责启动作业及获取作业执行状态;
  • ApplicationMaster(AM):负责输入数据分片、启动及管理Container、执行日志保存等;
  • Container:作业的实际执行者,负责启动Worker或PS(Parameter Server)进程,监控并向AM汇报进程状态,上传作业的输出等。对于TensorFlow类型作业,还负责启动TensorBoard服务。