About
本项目是 Apache Storm 官方文档的中文翻译版,致力于为有实时流计算项目需求和对 Apache Storm 感兴趣的同学提供有价值的中文资料,希望能够对大家的工作和学习有所帮助。
虽然 Storm 的正式推出已经有好几个年头了,发行版也已经到了 1.0.x(甚至官方文档已经到了 2.0.0-SNAPSHOT),但是目前网络上靠谱的学习资料仍然不多,很多比较有价值的资料都过时了(甚至官方网站自己的资料都没有及时更新,这大概也是发展太快的社区的通病),而较新的资料大多比较零碎,在关键内容的描述上也有些模棱两可,给初学者带来了很大的困扰。本人自己在初学 Storm 的阶段就非常痛苦,一直想有一份较系统、实用的资源来方便学习。最近借着整理工作的机会,就下定决心通过官方文档的翻译梳理出 Storm 的技术路线,于是就有了这个翻译项目。由于本人水平有限,翻译中仍然存在不少问题,还请大家不吝斧正。如果对本项目有任何问题,欢迎在本项目页面中提出,或者直接给本人发邮件(ivicoco at gmail.com),谢谢。
说明:如果没有特殊声明,本项目文档中所述 Storm 版本均为 0.9.x 版本。
Storm 官方文档索引
原文资料来源(官方网站):
http://storm.apache.org/documentation/Documentation.html
http://storm.apache.org/releases/0.9.6/index.html
Storm 基础篇
Trident
Trident
是 Storm 的一种高级操作接口,它能够提供可靠的数据流一次性处理模式、“事务型”数据持久化存储功能以及一系列数据流分析操作通用组件。
- Trident 教程 —— 基本概念与参考手册
- Trident API 概述 —— 数据的转换与整合操作
- Trident State —— 恰好一次的数据处理与快速、持久化的聚合操作
- Trident Spouts —— 事务型与非事务型数据入口
配置与部署
Storm 中级篇
- 序列化
- 常用模式
- Clojure DSL2
- 使用非 JVM 语言开发
- 分布式 RPC3
- 事务型拓扑4
- Storm 与 Kestrel
- 直接数据流组5
- Hooks
- Metrics
- Trident tuple 的生命周期5
Storm 高级篇
说明
1 JavaDoc 暂时不在翻译计划之中。
2 由于译者对 Clojure 不是很熟悉,相关内容暂时不提供翻译。
3 由于官方文档关于分布式 RPC 的部分内容已过时,这里重写了相关内容。
4 事务型拓扑已经由 Trident 实现,之前的实现已经被标记为@Deprecated
,这里不再讨论。
5 该文官方文档暂未提供。