Akka 库和模块概述
在深入研究 Actors 编程的一些最佳实践之前,预览最常用的 Akka 库会很有帮助。这将帮助你开始考虑你要在系统中使用的功能。所有核心的 Akka 功能都可以作为开源软件(OSS
)提供。Lightbend 支持 Akka 开发,但也可以给你提供「商业服务」,如培训、咨询、支持和「企业套件」,这是一套用于管理 Akka 系统的综合工具。
Akka OSS 包含以下功能,稍后将在本页介绍这些功能:
- Actor library
- Remoting
- Cluster Sharding
- Cluster
- Cluster Singleton
- Cluster Publish-Subscribe
- Persistence
- Distributed Data
- Streams
- HTTP
通过 LightBend 订阅,你可以在生产中使用「企业套件」。企业套件(Enterprise Suite
)包括对 Akka 核心功能的以下扩展:
- Split Brain Resolver — 检测和恢复网络分区,消除数据不一致和可能的停机时间。
- Multi-DC Persistence — 用于跨多个数据中心的双活(
active-active
)持久化实体。 - GDPR for Akka Persistence — 数据分解可用于忘记事件中的信息。
- Fast Failover — 群集分片(
Cluster Sharding
)的快速故障转移(Fast failover
)。 - Configuration Checker — 检查潜在的配置问题并记录建议。
- Diagnostics Recorder — 以便于在开发和生产过程中解决问题的格式捕获配置和系统信息。
- Thread Starvation Detector — 监控 Akka 系统的调度器,如果它没有响应,则记录警告。
本文不列出 Akka 的所有可用模块,但概述了主要功能,让你了解在 Akka 上构建系统时可以达到的复杂程度。
Actor library
<!-- Maven -->
<dependency>
<groupId>com.typesafe.akka</groupId>
<artifactId>akka-actor_2.11</artifactId>
<version>2.5.19</version>
</dependency>
<!-- Gradle -->
dependencies {
compile group: 'com.typesafe.akka', name: 'akka-actor_2.11', version: '2.5.19'
}
<!-- sbt -->
libraryDependencies += "com.typesafe.akka" %% "akka-actor" % "2.5.19"
Akka 的核心库是akka-actor
,但是 Actor 在整个 Akka 库中使用,它提供了一个一致的、集成的模型,使你能够独立地解决并发或分布式系统设计中出现的挑战。从鸟瞰图(birds-eye
)来看,Actor 是一种将 OOP 的支柱之一封装用到极致的编程范式。与对象不同,Actor 不仅封装了他们的状态,而且还封装了他们的执行。与 Actor 的通信不是通过方法调用,而是通过传递消息。虽然这种差异看起来很小,但实际上它允许我们在并发性和远程通信方面打破 OOP 的限制。别担心,如果这种描述感觉太高大上而无法完全理解,下一章我们将详细解释 Actor。现在,重要的一点是,这是一个在基础级别处理并发性和分布的模型,而不是将这些特性引入 OOP 的临时补丁尝试。
Actor 解决的挑战包括:
- 如何构建和设计高性能并发应用程序。
- 如何在多线程环境中处理错误。
- 如何保护自己的项目免受并发性的陷阱。
Remoting
<!-- Maven -->
<dependency>
<groupId>com.typesafe.akka</groupId>
<artifactId>akka-remote_2.11</artifactId>
<version>2.5.19</version>
</dependency>
<!-- Gradle -->
dependencies {
compile group: 'com.typesafe.akka', name: 'akka-remote_2.11', version: '2.5.19'
}
<!-- sbt -->
libraryDependencies += "com.typesafe.akka" %% "akka-remote" % "2.5.19"
远程处理(Remoting
)使存活(live
)在不同计算机上的 Actor 能够无缝地交换消息。虽然作为 JAR 制品(artifact
)分发,远程处理更像一个模块,而不是一个库。你主要通过配置来启用它,它只有几个 API。由于 Actor 模型,远程和本地消息发送看起来完全相同。在本地系统上使用的模式可以直接转换到远程系统。你很少需要直接使用远程处理,但它提供了构建集群子系统(Cluster subsystem
)的基础。
远程处理解决的挑战包括:
- 如何处理远程主机上的 Actor 系统。
- 如何在远程 Actor 系统上处理单个 Actor。
- 如何将消息转换为线路上的字节。
- 如何管理主机之间的低级(
low-level
)网络连接(和重新连接),如何透明地检测崩溃的 Actor 系统和主机。 - 如何透明的在同一网络连接上从一组不相关的 Actor 那里复用通信。
Cluster
<!-- Maven -->
<dependency>
<groupId>com.typesafe.akka</groupId>
<artifactId>akka-cluster_2.11</artifactId>
<version>2.5.19</version>
</dependency>
<!-- Gradle -->
dependencies {
compile group: 'com.typesafe.akka', name: 'akka-cluster_2.11', version: '2.5.19'
}
<!-- sbt -->
libraryDependencies += "com.typesafe.akka" %% "akka-cluster" % "2.5.19"
如果你有一组协作解决某些业务问题的 Actor 系统,那么你可能希望以规范的方式管理这些系统集(set of systems
)。当远程处理解决了与远程系统组件寻址和通信的问题时,集群(Clustering
)使你能够将它们组织成一个由成员协议绑定在一起的“元系统(meta-system
)”。在大多数情况下,你希望使用集群模块(Cluster module
)而不是直接使用远程处理。集群在远程处理之上提供了一组额外的服务,这是大多数实际应用程序所需要的。
集群模块解决的挑战包括:
- 如何维护一组 Actor 系统(一个集群),这些系统可以相互通信,并将彼此视为集群的一部分。
- 如何将新系统安全地引入到已经存在的成员集中。
- 如何可靠地检测暂时无法访问的系统。
- 如何删除失败的主机/系统(或缩小系统规模),以便集群中所有剩余的成员保持一致性。
- 如何在当前成员集中分布计算。
- 如何将集群成员指定到某个角色,换句话说,提供某些特定的服务而不是其他服务。
Cluster Sharding
<!-- Maven -->
<dependency>
<groupId>com.typesafe.akka</groupId>
<artifactId>akka-cluster-sharding_2.11</artifactId>
<version>2.5.19</version>
</dependency>
<!-- Gradle -->
dependencies {
compile group: 'com.typesafe.akka', name: 'akka-cluster-sharding_2.11', version: '2.5.19'
}
<!-- sbt -->
libraryDependencies += "com.typesafe.akka" %% "akka-cluster-sharding" % "2.5.19"
分片(Sharding
)有助于解决在 Akka 集群成员之间分配一组 Actor 的问题。分片是一种模式,它主要与持久性(Persistence
)一起使用,以将一大组需要持久化的实体(由 Actors 支持)平衡到集群的各个成员,并在成员崩溃或离开时将它们迁移到其他节点。
分片解决的挑战包括:
- 如何在一组系统上建模和扩展大规模有状态的实体。
- 如何确保集群中的实体正确分布,以便在机器之间保持平衡负载。
- 如何确保从崩溃的系统迁移实体而不丢失状态。
- 如何确保一个实体不同时存在于多个系统上,从而保持一致性。
Cluster Singleton
<dependency>
<groupId>com.typesafe.akka</groupId>
<artifactId>akka-cluster-singleton_2.11</artifactId>
<version>2.5.19</version>
</dependency>
<!-- Gradle -->
dependencies {
compile group: 'com.typesafe.akka', name: 'akka-cluster-singleton_2.11', version: '2.5.19'
}
<!-- sbt -->
libraryDependencies += "com.typesafe.akka" %% "akka-cluster-singleton" % "2.5.19"
分布式系统中的一个常见(事实上,有点太常见)用例是让一个实体负责一个给定的任务,该任务在集群的其他成员之间共享,并且在主机系统发生故障时进行迁移。尽管这无疑会给整个集群带来一个限制扩展的常见瓶颈,但在某些情况下,使用这种模式是不可避免的。集群单例(Cluster singleton
)允许集群选择一个 Actor 系统,该系统将承载一个特定的 Actor,而其他系统始终可以独立地访问该 Actor 承担的服务。
单例模块可用于解决这些挑战:
- 如何确保整个集群中只有一个服务实例在运行。
- 如何确保服务处于启动状态,即使承载它的系统在缩小规模的过程中崩溃或关闭。
- 如何从集群的任何成员访问这个实例,假设它可以随着时间迁移到其他系统。
Cluster Publish-Subscribe
<dependency>
<groupId>com.typesafe.akka</groupId>
<artifactId>akka-cluster-tools_2.11</artifactId>
<version>2.5.19</version>
</dependency>
<!-- Gradle -->
dependencies {
compile group: 'com.typesafe.akka', name: 'akka-cluster-tools_2.11', version: '2.5.19'
}
<!-- sbt -->
libraryDependencies += "com.typesafe.akka" %% "akka-cluster-tools" % "2.5.19"
为了在系统之间进行协调,通常需要将消息分发给集群中感兴趣的一组系统的所有系统或一个系统。这个模式通常被称为发布订阅,这个模块解决了这个确切的问题。可以向主题的所有订阅者广播消息,也可以向表示感兴趣的任意 Actor 发送消息。
集群发布订阅(Cluster Publish-Subscribe
)旨在解决以下挑战:
- 如何向集群中感兴趣的一组 Actor 广播消息。
- 如何从群集中感兴趣的一组 Actor 发送消息。
- 如何订阅和取消订阅集群中某个主题的事件。
Persistence
<dependency>
<groupId>com.typesafe.akka</groupId>
<artifactId>akka-persistence_2.11</artifactId>
<version>2.5.19</version>
</dependency>
<!-- Gradle -->
dependencies {
compile group: 'com.typesafe.akka', name: 'akka-persistence_2.11', version: '2.5.19'
}
<!-- sbt -->
libraryDependencies += "com.typesafe.akka" %% "akka-persistence" % "2.5.19"
就像 OOP 中的对象一样,Actor 将其状态保存在易失性内存中。一旦系统正常关闭或突然崩溃,内存中的所有数据都将丢失。持久性(Persistence
)提供了使 Actor 能够持久化导致其当前状态的事件的模式。启动时,可以重播事件以恢复由 Actor 承载的实体的状态。可以查询事件流并将其输入到其他处理管道(例如外部大数据集群)或备用视图(如报表)中。
持久性解决了以下挑战:
- 如何在系统重新启动或崩溃时恢复实体/参与者的状态。
- 如何实现「CQR)」系统。
- 如何在网络错误和系统崩溃时确保消息的可靠传递。
- 如何自查导致实体进入当前状态的域事件。
- 如何在项目继续发展的同时利用应用程序中的「事件源」来支持长期运行的流程。
Distributed Data
<dependency>
<groupId>com.typesafe.akka</groupId>
<artifactId>akka-distributed-data_2.11</artifactId>
<version>2.5.19</version>
</dependency>
<!-- Gradle -->
dependencies {
compile group: 'com.typesafe.akka', name: 'akka-distributed-data_2.11', version: '2.5.19'
}
<!-- sbt -->
libraryDependencies += "com.typesafe.akka" %% "akka-distributed-data" % "2.5.19"
在最终一致性可以接受的情况下,可以在 Akka 集群中的节点之间共享数据,甚至在集群分区面前也可以接受读和写。这可以通过使用「无冲突的复制数据类型(CRDTs)」来实现,其中不同节点上的写入可以并发进行,并随后以可预测的方式进行合并。分布式数据(Distributed Data
)模块提供了共享数据和许多有用数据类型的基础结构。
分布式数据旨在解决以下挑战:
- 如何接受即使面对群集分区的写入。
- 如何在保证低延迟本地读写访问的同时共享数据。
Streams
<dependency>
<groupId>com.typesafe.akka</groupId>
<artifactId>akka-stream_2.11</artifactId>
<version>2.5.19</version>
</dependency>
<!-- Gradle -->
dependencies {
compile group: 'com.typesafe.akka', name: 'akka-stream_2.11', version: '2.5.19'
}
<!-- sbt -->
libraryDependencies += "com.typesafe.akka" %% "akka-stream" % "2.5.19"
Actor 是并发性的基本模型,但是有一些共同的模式,它们的使用要求用户反复实现相同的模式。非常常见的情况是,Actor 的链或图需要处理潜在的大型或无限的连续事件流,并适当地协调资源使用,以便更快的处理阶段不会压倒链或图中较慢的阶段。流(Streams
)在 Actor 之上提供了更高级别的抽象,从而简化了编写此类处理网络、处理后台的所有细节,并提供了一个安全、类型化、可组合的编程模型。流也是响应式流(Reactive Streams
)标准的实现,它支持与该标准的所有第三方实现集成。
流解决了以下挑战:
- 如何以高性能处理事件流或大型数据集,如何利用并发性并保持资源使用的严格性。
- 如何将可重用的事件/数据处理片段组装成灵活的管道。
- 如何以灵活的、高性能的方式将异步服务相互连接。
- 如何提供或使用与第三方库接口的响应式流兼容接口。
HTTP
「Akka HTTP」是 Akka 的一个独立模块。
实际上,远程、内部或外部提供 API 的标准是「HTTP」。Akka 提供了一个库,通过提供一组工具来创建 HTTP 服务(并为其提供服务),以及一个可用于其他服务的客户端来使用此类 HTTP 服务。这些工具特别适合通过利用 Akka 流的底层模型来流入和流出大量数据或实时事件。
HTTP 解决的一些挑战:
- 如何通过 HTTP API 以高性能方式向外部公开系统或集群的服务。
- 如何使用 HTTP 将大型数据集流入和流出系统。
- 如何使用 HTTP 将活动事件(
live events
)流入和流出系统。
模块使用示例
Akka 模块无缝集成在一起。例如,想想网站用户访问的一大组有状态的业务对象,例如文档或购物车。如果你使用分片(Sharding
)和持久性(Persistence
)将它们建模为分片实体(sharded entities
),那么它们将在集群中得到平衡,你可以按需扩展。即使某些系统崩溃,它们也可以在广告活动高峰期间或节假日提供服务。你还可以使用持久性查询(Persistence Query
)获取域事件的实时流,并使用流(Streams
)将它们传输到流式快速数据引擎(Fast Data engine
)中。然后,将该引擎的输出作为流(Streams
),使用Akka Streams
操作符对其进行操作,并将其公开为由集群托管的一组负载平衡的 HTTP 服务器提供服务的 Web 套接字连接,以支持实时业务分析工具。
我们希望这次预览能引起你的兴趣!下一个主题将介绍我们在本指南的教程部分中构建的示例应用程序。
英文原文链接:Overview of Akka libraries and modules.