Rancher Server常见问题


1、Docker 运行Rancher server 容器应该注意什么?

需要注意运行rancher server 容器时,不要使用host模式。程序中有些地方定义的是localhost或者127.0.0.1,如果容器网络设置为host,将会去访问宿主机资源,因为宿主机并没有相应资源,rancher server 容器启动就出错。

  1. PS:docker命令中,如果使用了 --network host参数,那后面再使用-p 8080:8080 就不会生效。
  1. docker run -d -p 8080:8080 rancher/server:stable

此命令仅适用于单机测试环境,如果要生产使用Rancher server,请使用外置数据库(mysql)或者通过

  1. -v /xxx/mysql/:/var/lib/mysql -v /xxx/log/:/var/log/mysql -v /xxx/cattle/:/var/lib/cattle

把数据挂载到宿主机上。如果用外置数据库,需提前对数据库做性能优化,以保证Rancher 运行的最佳性能。

2、如何导出Rancher Server容器的内部数据库?

您可以通过简单的Docker命令从Rancher Server容器导出数据库。

  1. docker exec <CONTAINER_ID_OF_SERVER> mysqldump cattle > dump.sql

3、我正在运行的Rancher是什么版本的?

Rancher的版本位于UI的页脚的左侧。 如果您点击版本号,将可以查看其他组件的详细版本。

4、如果我没有在Rancher UI中删除主机而是直接删除会发生什么?

如果您的主机直接被删除,Rancher Server会一直显示该主机。主机会处于Reconnecting状态,然后转到Disconnected状态。您也可以通过添加主机再次把此节点添加到RANCHER 集群,如果不在使用此节点,可以在UI中删除。

如果您有添加了健康检查功能的服务自动调度到状态Disconnected主机上,CATTLE会将这些服务重新调度到其他主机上。

  1. PS:如果使用了标签调度,如果您有多台主机就有相同的调度标签,那么服务会调度到其他具有调度标签的节点上;如果选择了指定运行到某台主机上,那主机删除后您的应用将无法在其他主机上自动运行。

5、我如何在代理服务器后配置主机?

要在代理服务器后配置主机,您需要配置Docker的守护进程。详细说明参考在代理服务器后添加自定义主机

6、为什么同一主机在UI中多次出现?

宿主机上var/lib/rancher/state这个文件夹,这是Rancher用来存储用于标识主机的必要信息. .registration_token中保存了主机的验证信息,如果里面的信息发生变化,RANCHER会认为这是一台新主机, 在您执行添加主机后,UI上将会出现另外一台相同的主机,第一台主机接着处于失联状态。

7、在哪能找到Rancher Server容器的详细日志?

运行docker logs可以查看在Rancher Server容器的基本日志。要获取更详细的日志,您可以进入到Rancher Server容器内部并查看日志文件。

  1. 进入 Rancher Server 容器内部
  2. docker exec -it <container_id> bash
  3.  
  4. 跳转到 Cattle 日志所在的目录下
  5. cd /var/lib/cattle/logs/
  6. cat cattle-debug.log

在这个目录里面会出现cattle-debug.logcattle-error.log。 如果您长时间使用此Rancher Server,您会发现我们每天都会创建一个新的日志文件。

8、将Rancher Server的日志复制到主机上。

以下是将Rancher Server日志从容器复制到主机的命令。

  1. docker cp <container_id>:/var/lib/cattle/logs /local/path

9、如果Rancher Server的IP改变了会怎么样?

如果更改了Rancher Server的IP地址,您需要用新的IP重新注册主机。

在Rancher中,点击系统管理->系统设置更新 Rancher Server的主机注册地址。注意必须包括Rancher Server暴露的端口号。默认情况下我们建议按照安装手册中使用8080端口。

主机注册更新后,进入基础架构->添加主机->自定义。 添加主机的docker run命令将会更新。 使用更新的命令,在Rancher Server的所有环境中的所有主机上运行该命令。

10、Rancher Server运行变得很慢,怎么去优化它?

很可能有一些任务由于某些原因而处于僵死状态,如果您能够用界面查看系统管理 -> 系统进程,您将可以看到Running中的内容,如果这些任务长时间运行(并且失败),则Rancher会最终使用太多的内存来跟踪任务。这使得Rancher Server处于了内存不足的状态。

为了使服务变为可响应状态,您需要添加更多内存。通常4GB的内存就够了。

您需要再次运行Rancher Server命令并且添加一个额外的选项-e JAVA_OPTS="-Xmx4096m"

  1. docker run -d -p 8080:8080 --restart=unless-stopped -e JAVA_OPTS="-Xmx4096m" rancher/server

根据MySQL数据库的设置方式的不同,您可能需要进行升级才能添加该选项。

如果是由于缺少内存而无法看到系统管理 -> 系统进程的话,那么在重启Rancher Server之后,已经有了更多的内存。您现在应该可以看到这个页面了,并可以开始对运行时间最长的进程进行故障分析。

11、Rancher Server数据库数据增长太快.

Rancher Server会自动清理几个数据库表,以防止数据库增长太快。如果对您来说这些表没有被及时清理,请使用API来更新清理数据的时间间隔。

在默认情况下,产生在2周以前的container_eventservice_event表中的数据则数据会被删除。在API中的设置是以秒为单位的(1209600)。API中的设置为events.purge.after.seconds.

默认情况下,process_instance表在1天前产生的数据将会被删除,在API中的设置是以秒为单位的(86400)。API中的设置为process_instance.purge.after.seconds.

为了更新API中的设置,您可以跳转到http://<rancher-server-ip>:8080/v1/settings页面, 搜索要更新的设置,点击links -> self跳转到您点击的链接去设置,点击侧面的“编辑”更改’值’。 请记住,值是以秒为单位。

12、为什么Rancher Server升级失败导致数据库被锁定?

如果您刚开始运行Rancher并发现它被永久冻结,可能是liquibase数据库上锁了。在启动时,liquibase执行模式迁移。它的竞争条件可能会留下一个锁定条目,这将阻止后续的流程。

如果您刚刚升级,在Rancher Server日志中,MySQL数据库可能存在尚未释放的日志锁定。

  1. ....liquibase.exception.LockException: Could not acquire change log lock. Currently locked by <container_ID>

释放数据库锁

注意: 请不要释放数据库锁,除非有相关日志锁的异常。如果是由于数据迁移导致升级时间过长,在这种情况下释放数据库锁,可能会使您遇到其他迁移问题。

如果您已根据升级文档创建了Rancher Server的数据容器,您需要execrancher-data容器中升级DATABASECHANGELOGLOCK表并移除锁,如果您没有创建数据容器,您用exec到包含有您数据库的容器中。

  1. sudo docker exec -it <container_id> mysql

一旦进入到 Mysql 数据库, 您就要访问cattle数据库。

  1. mysql> use cattle;
  2.  
  3. 检查表中是否有锁
  4. mysql> select * from DATABASECHANGELOGLOCK;
  5.  
  6. 更新移除容器的锁
  7. mysql> update DATABASECHANGELOGLOCK set LOCKED="", LOCKGRANTED=null, LOCKEDBY=null where ID=1;
  8.  
  9. 检查锁已被删除
  10. mysql> select * from DATABASECHANGELOGLOCK;
  11. +----+--------+-------------+----------+
  12. | ID | LOCKED | LOCKGRANTED | LOCKEDBY |
  13. +----+--------+-------------+----------+
  14. | 1 | | NULL | NULL |
  15. +----+--------+-------------+----------+
  16. 1 row in set (0.00 sec)

13、管理员密码忘记了,我该如何重置管理员密码?

如果您的身份认证出现问题(例如管理员密码忘记),则可能无法访问Rancher。 要重新获得对Rancher的访问权限,您需要在数据库中关闭访问控制。 为此,您需要访问运行Rancher Server的主机。

ps:假设在重置访问控制之前有创建过其他用户,那么在认证方式没有变化的情况下,重置访问控制除了超级管理员(第一个被创建的管理员,ID为1a1),其他用户账号信息不会受影响。

  • 假设数据库为rancher内置数据库
  1. docker exec -it <rancher_server_container_ID> mysql

注意: 这个 <rancher_server_container_ID>是具有Rancher数据库的容器。 如果您升级并创建了一个Rancher数据容器,则需要使用Rancher数据容器的ID而不是Rancher Server容器,rancher内置数据库默认密码为空。

  • 选择Cattle数据库。
  1. mysql> use cattle;
  • 查看setting表。
  1. mysql> select * from setting;
  • 更改api.security.enabledfalse,并清除api.auth.provider.configured的值。
  1. # 关闭访问控制
  2. mysql> update setting set value="false" where name="api.security.enabled";
  3. # 清除认证方式
  4. mysql> update setting set value="" where name="api.auth.provider.configured";
  • 确认更改在setting表中是否生效。
  1. mysql> select * from setting;
  • 可能需要约1分钟才能在用户界面中关闭身份认证,然后您可以通过刷新网页来登陆没有访问控制的Rancher Server

关闭访问控制后,任何人都可以使用UI/API访问Rancher Server。

  • 刷新页面,在系统管理| 访问控制 重新开启访问控制。重新开启访问控制填写的管理员用户名将会替换原有的超级管理员用户名(ID为1a1 )。

14、Rancher Compose Executor和Go-Machine-Service不断重启.

在高可用集群中,如果您正在使用代理服务器后,如果rancher-compose-executor和go-machine-service不断重启,请确保您的代理使用正确的协议。

15、我怎么样在代理服务器后运行Rancher Server?

请参照在HTTP代理后方启动Rancher Server.

16、为什么在日志中看到Go-Machine-Service在不断重新启动? 我该怎么办?

Go-machine-service是一种通过websocket连接到Rancher API服务器的微服务。如果无法连接,则会重新启动并再次尝试。如果您运行的是单节点的Rancher Server,它将使用您为主机注册地址来连接到Rancher API服务。 检查从Rancher Sever容器内部是否可以访问主机注册地址。

  1. docker exec -it <rancher-server_container_id> bash
  2. Rancher-Server 容器内
  3. curl -i <Host Registration URL you set in UI>/v1

您应该得到一个json响应。 如果认证开启,响应代码应为401。如果认证未打开,则响应代码应为200。验证Rancher API Server 能够使用这些变量,通过登录go-machine-service容器并使用您提供给容器的参数进行curl命令来验证连接:

  1. docker exec -it <go-machine-service_container_id> bash
  2. go-machine-service 容器内
  3. curl -i -u '<value of CATTLE_ACCESS_KEY>:<value of CATTLE_SECRET_KEY>' <value of CATTLE_URL>

您应该得到一个json响应和200个响应代码。如果curl命令失败,那么在go-machine-service和Rancher API server之间存在连接问题。如果curl命令没有失败,则问题可能是因为go-machine-service尝试建立websocket连接而不是普通的http连接。 如果在go-machine-service和Rancher API服务器之间有代理或负载平衡,请验证代理是否支持websocket连接。

17、rancher catalog 多久同步一次

http://X.X.X.X/v1/settings/catalog.refresh.interval.seconds 默认300秒 可以修改 点setting会立即更新

18、Rancher server cattle-debug.log 文件占满磁盘的问题

这个问题主要在Rancher server 1.6.11 之前(1.6.11 已经解决)

目前是按天来创建日志文件, 如果日志文件太多会进行日志分段,每一段默认100M, 默认情况下,系统保留5个分段。通过打开http://rancher_url:8080/v2-beta/settings ,网页搜索 logback 可以看到以下内容,

  1. {
  2. "id": "logback.max.file.size",
  3. "type": "activeSetting",
  4. "links": {
  5. "self": "…/v2-beta/settings/logback.max.file.size"
  6. },
  7.  
  8. "actions": { },
  9. "baseType": "setting",
  10. "name": "logback.max.file.size",
  11. "activeValue": "100MB",
  12. "inDb": false,
  13. "source": "Code Packaged Defaults",
  14. "value": "100MB"
  15. },
  16. {
  17. "id": "logback.max.history",
  18. "type": "activeSetting",
  19. "links": {
  20. "self": "…/v2-beta/settings/logback.max.history"
  21. },
  22. "actions": { },
  23. "baseType": "setting",
  24. "name": "logback.max.history",
  25. "activeValue": "5",
  26. "inDb": false,
  27. "source": "Code Packaged Defaults",
  28. "value": "5"
  29. },

点击self 后的相应类型,比如”self”: “…/v2-beta/settings/logback.max.history” 可以做相应参数调整。

相应issue:https://github.com/rancher/rancher/issues/9887

19、Rancher server 如何免密更新Catalog

在配置私有仓库地址的时候,添加用户名和密码

  1. https://{username}:{password}@github.com/{repo}

20、修改server 日志等级

默认情况下,server日志记录等级为INFO,可以按照以下方法修改:

通过打开 http://rancher_url:8080/v2-beta/settings/auth.service.log.level ,

mage-20180329174623

点击编辑 修改

mage-20180329174705

mage-20180329174723

点击show Request,再点击send Request.

mage-20180329174815

21、禁止新用户不创建default 环境

默认情况下,新用户第一次登录会创建default环境,通过设置API可以禁止此设置:

通过打开 http://rancher_url:8080/v2-beta/settings/project.create.default

mage-20180329175124

修改value值为false

mage-20180329175151