1. Etcd是什么(what)
etcd is a distributed, consistent key-value store for shared configuration and service discovery, with a focus on being:
- Secure: automatic TLS with optional client cert authentication[可选的SSL客户端证书认证:支持https访问 ]
- Fast: benchmarked 10,000 writes/sec[单实例每秒 1000 次写操作]
- Reliable: properly distributed using Raft[使用Raft保证一致性]
etcd是一个分布式、一致性的键值存储系统,主要用于配置共享和服务发现。[以上内容来自etcd官网]
2. 为什么使用Etcd(why)
2.1. Etcd的优势
- 简单。使用Go语言编写部署简单;使用HTTP作为接口使用简单;使用Raft算法保证强一致性让用户易于理解。
- 数据持久化。etcd默认数据一更新就进行持久化。
- 安全。etcd支持SSL客户端安全认证。
3. 如何实现Etcd架构(how)
3.1. Etcd的相关名词解释
- Raft:etcd所采用的保证分布式系统强一致性的算法。
- Node:一个Raft状态机实例。
- Member: 一个etcd实例。它管理着一个Node,并且可以为客户端请求提供服务。
- Cluster:由多个Member构成可以协同工作的etcd集群。
- Peer:对同一个etcd集群中另外一个Member的称呼。
- Client: 向etcd集群发送HTTP请求的客户端。
- WAL:预写式日志,etcd用于持久化存储的日志格式。
- snapshot:etcd防止WAL文件过多而设置的快照,存储etcd数据状态。
- Proxy:etcd的一种模式,为etcd集群提供反向代理服务。
- Leader:Raft算法中通过竞选而产生的处理所有数据提交的节点。
- Follower:竞选失败的节点作为Raft中的从属节点,为算法提供强一致性保证。
- Candidate:当Follower超过一定时间接收不到Leader的心跳时转变为Candidate开始竞选。【候选人】
- Term:某个节点成为Leader到下一次竞选时间,称为一个Term。【任期】
- Index:数据项编号。Raft中通过Term和Index来定位数据。
3.2. Etcd的架构图
一个用户的请求发送过来,会经由HTTP Server转发给Store进行具体的事务处理,如果涉及到节点的修改,则交给Raft模块进行状态的变更、日志的记录,然后再同步给别的etcd节点以确认数据提交,最后进行数据的提交,再次同步。
1、HTTP Server:
用于处理用户发送的API请求以及其它etcd节点的同步与心跳信息请求。
2、Raft:
Raft强一致性算法的具体实现,是etcd的核心。
3、WAL:
Write Ahead Log(预写式日志),是etcd的数据存储方式,用于系统提供原子性和持久性的一系列技术。除了在内存中存有所有数据的状态以及节点的索引以外,etcd就通过WAL进行持久化存储。WAL中,所有的数据提交前都会事先记录日志。
Entry[日志内容]:
负责存储具体日志的内容。
Snapshot[快照内容]:
Snapshot是为了防止数据过多而进行的状态快照,日志内容发生变化时保存Raft的状态。
4、Store:
用于处理etcd支持的各类功能的事务,包括数据索引、节点状态变更、监控与反馈、事件处理与执行等等,是etcd对用户提供的大多数API功能的具体实现。