后端部署文档

后端有2种部署方式,分别为自动化部署和编译源码部署

1、准备工作

请下载最新版本的安装包,下载地址: 下载

准备一: 基础软件安装(必装项请自行安装)

  • PostgreSQL (8.2.15+) or Mysql (5.5+) : 两者任选其一即可
  • JDK (1.8+) : 必装
  • ZooKeeper (3.4.6+) :必装
  • Hadoop (2.6+) or MinIo :选装, 如果需要使用到资源上传功能,可以选择Hadoop or MinIo
  • Hive(1.2.1) : 选装,hive任务提交需要安装
  • Spark (1.x,2.x) : 选装,Spark任务提交需要安装
  1. 注意:DolphinScheduler本身不依赖HadoopHiveSparkPostgreSQL,仅是会调用他们的Client,用于对应任务的运行。

准备二: 创建部署用户

  • 在所有需要部署调度的机器上创建部署用户,因为worker服务是以 sudo -u {linux-user} 方式来执行作业,所以部署用户需要有 sudo 权限,而且是免密的。
  1. vi /etc/sudoers
  2. # 例如部署用户是dolphinscheduler账号
  3. dolphinscheduler ALL=(ALL) NOPASSWD: NOPASSWD: ALL
  4. # 并且需要注释掉 Default requiretty 一行
  5. #Default requiretty

准备三: ssh免密配置

在部署机器和其他安装机器上配置ssh免密登录,如果要在部署机上安装调度,需要配置本机免密登录自己

  • 主机器 和各个其它机器SSH免密打通

准备四:数据库初始化

  • 创建database和账号

执行以下命令创建database和账号

  1. CREATE DATABASE dolphinscheduler DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
  2. GRANT ALL PRIVILEGES ON dolphinscheduler.* TO '{user}'@'%' IDENTIFIED BY '{password}';
  3. GRANT ALL PRIVILEGES ON dolphinscheduler.* TO '{user}'@'localhost' IDENTIFIED BY '{password}';
  4. flush privileges;
  • 创建表和导入基础数据修改./conf/application-dao.properties中的下列属性
  1. spring.datasource.url
  2. spring.datasource.username
  3. spring.datasource.password

执行创建表和导入基础数据脚本

  1. sh ./script/create-dolphinscheduler.sh

准备五: 修改部署目录权限及运行参数

  1. dophinscheduler-backend目录介绍
  1. bin : 基础服务启动脚本
  2. conf : 项目配置文件
  3. DISCLAIMER : DISCLAIMER文件
  4. lib : 项目依赖jar包,包括各个模块jar和第三方jar
  5. LICENSE : LICENSE文件
  6. licenses : 运行时license
  7. NOTICE : NOTICE文件
  8. script : 集群启动、停止和服务监控启停脚本
  9. sql : 项目依赖sql文件
  10. install.sh : 一键部署脚本
  • 修改权限(请将'deployUser'字段修改为对应部署用户),使得部署用户对dolphinscheduler-backend目录有操作权限

sudo chown -R deployUser:deployUser dolphinscheduler-backend

  • 修改conf/env/目录下的 .dolphinscheduler_env.sh 环境变量

  • 修改部署参数(根据自己服务器及业务情况):

  • 修改 install.sh中的各参数,替换成自身业务所需的值

    • monitorServerState 开关变量,在1.0.3版本中增加,控制是否启动自启动脚本(监控master,worker状态,如果掉线会自动启动)默认值为"false"表示不启动自启动脚本,如果需要启动改为"true"

    • hdfsStartupSate 开关变量,控制是否启动hdfs默认值为"false"表示不启动hdfs如果需要启动改为"true",启动hdfs需要自行创建hdfs根路径,也就是install.sh中的 hdfsPath

  • 如果使用hdfs相关功能,需要拷贝hdfs-site.xmlcore-site.xml到conf目录下

2、部署

以下两种方式任选其一部署即可,推荐自动化部署,有经验的小伙伴也可以使用源码部署

2.1 自动部署

  • 安装zookeeper工具

pip install kazoo

  • 切换到部署用户,一键部署

sh install.sh

  • 使用jps命令查看服务是否启动(jpsjava JDK自带)
  1. MasterServer ----- master服务
  2. WorkerServer ----- worker服务
  3. LoggerServer ----- logger服务
  4. ApiApplicationServer ----- api服务
  5. AlertServer ----- alert服务

如果以上服务都正常启动,说明自动部署成功

部署成功后,可以进行日志查看,日志统一存放于指定文件夹内

  1. logs/
  2. ├── dolphinscheduler-alert-server.log
  3. ├── dolphinscheduler-master-server.log
  4. |—— dolphinscheduler-worker-server.log
  5. |—— dolphinscheduler-api-server.log
  6. |—— dolphinscheduler-logger-server.log

2.2 编译源码来部署

将源码包release版本下载后,解压进入根目录

  • 执行编译命令:
  1. mvn -U clean package -Prelease -Dmaven.test.skip=true
  • 查看目录

正常编译完后,会在 dolphinscheduler-dist/dolphinscheduler-backend/target目录下生成apache-dolphinscheduler-incubating-${latest.release.version}-dolphinscheduler-backend-bin.tar.gz

  1. ../
  2. ├── bin
  3. ├── conf
  4. |── DISCLAIMER
  5. |—— install.sh
  6. |—— lib
  7. |—— LICENSE
  8. |—— licenses
  9. |—— NOTICE
  10. |—— script
  11. |—— sql

2.3 系统常用启停服务(服务用途请具体参见《系统架构设计》小节)

  • 一键停止集群所有服务

sh ./bin/stop-all.sh

  • 一键开启集群所有服务

sh ./bin/start-all.sh

  • 启停Master
  1. sh ./bin/dolphinscheduler-daemon.sh start master-server
  2. sh ./bin/dolphinscheduler-daemon.sh stop master-server
  • 启停Worker
  1. sh ./bin/dolphinscheduler-daemon.sh start worker-server
  2. sh ./bin/dolphinscheduler-daemon.sh stop worker-server
  • 启停Api
  1. sh ./bin/dolphinscheduler-daemon.sh start api-server
  2. sh ./bin/dolphinscheduler-daemon.sh stop api-server
  • 启停Logger
  1. sh ./bin/dolphinscheduler-daemon.sh start logger-server
  2. sh ./bin/dolphinscheduler-daemon.sh stop logger-server
  • 启停Alert
  1. sh ./bin/dolphinscheduler-daemon.sh start alert-server
  2. sh ./bin/dolphinscheduler-daemon.sh stop alert-server

3、数据库升级

修改./conf/application-dao.properties中的下列属性

  1. ```
  2. spring.datasource.url
  3. spring.datasource.username
  4. spring.datasource.password
  5. ```

执行以下命令即可自动升级数据库

  1. sh ./script/upgrade-dolphinscheduler.sh