[搜文档] spark - 搜索结果 - 书栈网

书栈网 · BookStack 本次搜索耗时 0.095 秒，为您找到 3954 个相关结果.

RDDs

1083 2018-02-05 《Spark 编程指南简体中文版》

RDDs 利用反射推断模式编程指定模式 RDDs Spark支持两种方法将存在的RDDs转换为SchemaRDDs。第一种方法使用反射来推断包含特定对象类型的RDD的模式(schema)。在你写spark程序的同时，当你已经知道了模式，这种基于反射的方法可以使代码更简洁并且程序工作得更好。创建SchemaRDDs的第二种方法是通过一个编程接...
Scenario

522 2020-05-24 《IoTDB User Guide (V0.8.x)》

Scenario Scenario 1 Scenario 2 Scenario 3 Scenario 4 Scenario Scenario 1 A company uses surface mount technology (SMT) to produce chips: it is necessary to first print so...
Built-in Functions

189 2023-04-16 《Spark SQL, DataFrames and Datasets Guide v3.4.0》

Built-in Functions Aggregate Functions Examples Window Functions Examples Array Functions Examples Map Functions Examples Date and Timestamp Functions Examples JSON Funct...
SET

159 2023-04-17 《Spark SQL, DataFrames and Datasets Guide v3.4.0》

SET Description Syntax Parameters Examples Related Statements SET Description The SET command sets a property, returns the value of an existing property or returns all SQL...
应用场景

437 2023-04-07 《Apache IoTDB 用户手册 (v1.0.x)》

应用场景应用场景场景 1 某公司采用表面贴装技术（SMT）生产芯片：需要首先在芯片上的焊接点处印刷（即涂抹）锡膏，然后将元器件放置在锡膏上，进而通过加热熔化锡膏并冷却，使得元器件被焊接在芯片上。上述流程采用自动化生产线。为了确保产品质量合格，在印刷锡膏后，需要通过光学设备对锡膏印刷的质量进行评估：采用三维锡膏印刷检测（SPI）设备对每个焊接点上...
一、累加器

790 2020-06-07 《AI算法工程师手册》

一、累加器 1.1 Accumulator 1.2 累加器与容错性一、累加器在集群中执行代码时，一个难点是：理解变量和方法的范围、生命周期。下面是一个闭包的例子： x counter = 0 rdd = sc . parallelize ( data ) def increment_counter ( x ): ...
导入Kafka数据

471 2021-11-04 《Nebula Graph Database v2.5.1 图数据库手册》

导入Kafka数据环境配置前提条件操作步骤步骤 1：在Nebula Graph中创建Schema 步骤 2：修改配置文件步骤 3：向Nebula Graph导入数据步骤 4：（可选）验证数据步骤 5：（如有）在Nebula Graph中重建索引导入Kafka数据本文简单说明如何使用Exchange将存储在Kafka上的...
异常诊断与调试

384 2021-07-01 《Alluxio 社区版 v2.6官方文档》

异常诊断与调试 Alluxio日志地址 Alluxio远程调试 Alluxio部署常见问题问题: 在本地机器上初次安装使用Alluxio失败，应该怎么办？问题: 打算在Spark/HDFS集群中部署Alluxio，有什么建议？ ALLuxio使用常见问题问题：出现“No FileSystem for scheme: alluxio”这种错误信...
对比

927 2021-07-19 《Apache Hudi v0.8.0 官方文档》

对比 Kudu Hive事务 HBase 流式处理对比 Apache Hudi填补了在DFS上处理数据的巨大空白，并可以和这些技术很好地共存。然而，通过将Hudi与一些相关系统进行对比，来了解Hudi如何适应当前的大数据生态系统，并知晓这些系统在设计中做的不同权衡仍将非常有用。 Kudu Apache Kudu 是一个与Hudi具有...
对比

1394 2020-06-06 《Apache Hudi 0.5 中文教程》

Kudu Hive事务 HBase 流式处理 Apache Hudi填补了在DFS上处理数据的巨大空白，并可以和这些技术很好地共存。然而，通过将Hudi与一些相关系统进行对比，来了解Hudi如何适应当前的大数据生态系统，并知晓这些系统在设计中做的不同权衡仍将非常有用。 Kudu Apache Kudu 是一个与Hudi具有相似目标的存储系统...

RDDs

Scenario

Built-in Functions

SET

应用场景

一、累加器

导入Kafka数据

异常诊断与调试

对比

对比