原文链接 : http://zeppelin.apache.org/docs/0.7.2/install/build.html

译文链接 : http://cwiki.apachecn.org/pages/viewpage.action?pageId=10030615

贡献者 : 片刻 ApacheCN Apache中文网

如果要从源代码构建,则必须先安装以下依赖项:

NameValue
Git(Any Version)
Maven3.1.x or higher
JDK1.7

如果您还没有安装Git和Maven,请查看“ 构建要求”部分,并按照步骤说明进行操作。

1. 克隆Apache Zeppelin存储库

  1. git clone https://github.com/apache/zeppelin.git

2. 源码编译

您可以使用以下maven命令构建Zeppelin:

  1. mvn clean package -DskipTests [Options]

如果您不确定选项,请使用相同的命令来创建官方二进制包。

  1. # update all pom.xml to use scala 2.11
  2. ./dev/change_scala_version.sh 2.11
  3. # build zeppelin with all interpreters and include latest version of Apache spark support for local mode.
  4. mvn clean package -DskipTests -Pspark-2.0 -Phadoop-2.4 -Pyarn -Ppyspark -Psparkr -Pr -Pscala-2.11

3. 完成

您可以通过成功构建后运行直接启动Zeppelin:

  1. ./bin/zeppelin-daemon.sh start

检查构建配置文件部分以获取进一步的构建选项。如果您在代理服务器后面,请按照代理设置部分中的说明进行操作。

如果您对贡献感兴趣,请检查贡献Apache Zeppelin(代码)贡献Apache Zeppelin(网站)



构建配置文件

Spark 解释器

要使用特定的Spark版本,Hadoop版本或特定功能构建,请定义一个或多个以下配置文件和选项:


-Pspark-[version]

设置 spark 主要版本

可用的配置文件是

  1. -Pspark-2.1
  2. -Pspark-2.0
  3. -Pspark-1.6
  4. -Pspark-1.5
  5. -Pspark-1.4
  6. -Pcassandra-spark-1.5
  7. -Pcassandra-spark-1.4
  8. -Pcassandra-spark-1.3
  9. -Pcassandra-spark-1.2
  10. -Pcassandra-spark-1.1

小版本可以调整 -Dspark.version=x.x.x

-Phadoop-[version]

设置hadoop主要版本

可用的配置文件是

  1. -Phadoop-0.23
  2. -Phadoop-1
  3. -Phadoop-2.2
  4. -Phadoop-2.3
  5. -Phadoop-2.4
  6. -Phadoop-2.6
  7. -Phadoop-2.7

小版本可以调整 -Dhadoop.version=x.x.x

-Pscala-[version] (optional)

设置scala版本(默认2.10)可用的配置文件

  1. -Pscala-2.10
  2. -Pscala-2.11

-Pyarn (可选的)

启用对本地模式的YARN支持

  1. Spark v1.5.0或更高版本不支持YARN用于本地模式。设置SPARK_HOME代替

-Ppyspark (可选的)

启用PySpark支持本地模式。

-Pr (可选的)

使用SparkR集成启用R支持。

-Psparkr (可选的)

另一个R支持与SparkR集成以及本地模式支持。

-Pvendor-repo (可选的)

启用第三方供应商存储库(cloudera)

-Pmapr[version] (可选的)

对于MapR Hadoop Distribution,这些配置文件将处理Hadoop版本。至于MAPR允许安装不同版本星火的,则应该通过添加一个Spark的个人资料(指定星火的版本安装在群集上-Pspark-1.6-Pspark-2.0根据需要,等等)。可以在http://doc.mapr.com的每个版本的MapR找到正确的Maven工件

可用的配置文件是

  1. -Pmapr3
  2. -Pmapr40
  3. -Pmapr41
  4. -Pmapr50
  5. -Pmapr51

-Pexamples(可选)

zeppelin-examples目录下的粗体示例

构建命令示例

以下是几个选项的示例:

  1. # build with spark-2.1, scala-2.11
  2. ./dev/change_scala_version.sh 2.11
  3. mvn clean package -Pspark-2.1 -Phadoop-2.4 -Pyarn -Ppyspark -Psparkr -Pscala-2.11 -DskipTests
  4.  
  5. # build with spark-2.0, scala-2.11
  6. ./dev/change_scala_version.sh 2.11
  7. mvn clean package -Pspark-2.0 -Phadoop-2.4 -Pyarn -Ppyspark -Psparkr -Pscala-2.11 -DskipTests
  8.  
  9. # build with spark-1.6, scala-2.10
  10. mvn clean package -Pspark-1.6 -Phadoop-2.4 -Pyarn -Ppyspark -Psparkr -DskipTests
  11.  
  12. # spark-cassandra integration
  13. mvn clean package -Pcassandra-spark-1.5 -Dhadoop.version=2.6.0 -Phadoop-2.6 -DskipTests -DskipTests
  14.  
  15. # with CDH
  16. mvn clean package -Pspark-1.5 -Dhadoop.version=2.6.0-cdh5.5.0 -Phadoop-2.6 -Pvendor-repo -DskipTests
  17.  
  18. # with MapR
  19. mvn clean package -Pspark-1.5 -Pmapr50 -DskipTests

Ignite 解释器

  1. mvn clean package -Dignite.version=1.9.0 -DskipTests

Scalding 解释器

  1. mvn clean package -Pscalding -DskipTests

构建要求

安装要求

如果您没有准备好要求,请安装它。(安装方法可能会根据您的环境而有所不同,例如Ubuntu。)

  1. sudo apt-get update
  2. sudo apt-get install git
  3. sudo apt-get install openjdk-7-jdk
  4. sudo apt-get install npm
  5. sudo apt-get install libfontconfig

安装maven

  1. wget http://www.eu.apache.org/dist/maven/maven-3/3.3.9/binaries/apache-maven-3.3.9-bin.tar.gz
  2. sudo tar -zxf apache-maven-3.3.9-bin.tar.gz -C /usr/local/
  3. sudo ln -s /usr/local/apache-maven-3.3.9/bin/mvn /usr/local/bin/mvn

注意: - 确保节点通过运行安装node —version- 确保maven正在运行版本3.1.x或更高版本mvn -version - 配置maven使用比平常更多的内存export MAVEN_OPTS="-Xmx2g -XX:MaxPermSize=1024m"

代理设置(可选)

如果您在代理服务器后面,您需要配置maven和npm以通过它。

首先,配置你的maven ~/.m2/settings.xml

  1. <settings>
  2. <proxies>
  3. <proxy>
  4. <id>proxy-http</id>
  5. <active>true</active>
  6. <protocol>http</protocol>
  7. <host>localhost</host>
  8. <port>3128</port>
  9. <!-- <username>usr</username>
  10. <password>pwd</password> -->
  11. <nonProxyHosts>localhost|127.0.0.1</nonProxyHosts>
  12. </proxy>
  13. <proxy>
  14. <id>proxy-https</id>
  15. <active>true</active>
  16. <protocol>https</protocol>
  17. <host>localhost</host>
  18. <port>3128</port>
  19. <!-- <username>usr</username>
  20. <password>pwd</password> -->
  21. <nonProxyHosts>localhost|127.0.0.1</nonProxyHosts>
  22. </proxy>
  23. </proxies>
  24. </settings>

然后,下一个命令将配置npm。

  1. npm config set proxy http://localhost:3128
  2. npm config set https-proxy http://localhost:3128
  3. npm config set registry "http://registry.npmjs.org/"
  4. npm config set strict-ssl false

配置git也是如此

  1. git config --global http.proxy http://localhost:3128
  2. git config --global https.proxy http://localhost:3128
  3. git config --global url."http://".insteadOf git://

要清理,active false在Maven 中设置settings.xml并运行这些命令。

  1. npm config rm proxy
  2. npm config rm https-proxy
  3. git config --global --unset http.proxy
  4. git config --global --unset https.proxy
  5. git config --global --unset url."http://".insteadOf

注意: - 如果您在NTLM代理之后,您可以使用Cntlm身份验证代理。- 用localhost:3128标准图案替换http://user:pwd@host:port

要打包包含压缩归档的最终发行版,请运行:

  1. mvn clean package -Pbuild-distr

要构建具有特定配置文件的发行版,请运行:

  1. mvn clean package -Pbuild-distr -Pspark-1.5 -Phadoop-2.4 -Pyarn -Ppyspark

-Pspark-1.5 -Phadoop-2.4 -Pyarn -Ppyspark如果您希望构建特定的火花版本,或者省略支持,可以调整配置文件yarn

存档在目录下zeppelin-distribution/target生成

运行端到端测试

Zeppelin提供了一套端到端验收测试,运行headless selenium浏览器

  1. # assumes zeppelin-server running on localhost:8080 (use -Durl=.. to override)
  2. mvn verify
  3.  
  4. # or take care of starting/stoping zeppelin-server from packaged zeppelin-distribuion/target
  5. mvn verify -P using-packaged-distr

Analytics