书栈网 · BookStack 本次搜索耗时 0.095 秒,为您找到 3954 个相关结果.
  • RDDs

    RDDs 利用反射推断模式 编程指定模式 RDDs Spark支持两种方法将存在的RDDs转换为SchemaRDDs。第一种方法使用反射来推断包含特定对象类型的RDD的模式(schema)。在你写spark程序的同时,当你已经知道了模式,这种基于反射的方法可以使代码更简洁并且程序工作得更好。 创建SchemaRDDs的第二种方法是通过一个编程接...
  • Scenario

    Scenario Scenario 1 Scenario 2 Scenario 3 Scenario 4 Scenario Scenario 1 A company uses surface mount technology (SMT) to produce chips: it is necessary to first print so...
  • Built-in Functions

    Built-in Functions Aggregate Functions Examples Window Functions Examples Array Functions Examples Map Functions Examples Date and Timestamp Functions Examples JSON Funct...
  • SET

    SET Description Syntax Parameters Examples Related Statements SET Description The SET command sets a property, returns the value of an existing property or returns all SQL...
  • 应用场景

    应用场景 应用场景 场景 1 某公司采用表面贴装技术(SMT)生产芯片:需要首先在芯片上的焊接点处印刷(即涂抹)锡膏,然后将元器件放置在锡膏上,进而通过加热熔化锡膏并冷却,使得元器件被焊接在芯片上。上述流程采用自动化生产线。为了确保产品质量合格,在印刷锡膏后,需要通过光学设备对锡膏印刷的质量进行评估:采用三维锡膏印刷检测(SPI)设备对每个焊接点上...
  • 一、累加器

    一、累加器 1.1 Accumulator 1.2 累加器与容错性 一、累加器 在集群中执行代码时,一个难点是:理解变量和方法的范围、生命周期。下面是一个闭包的例子: ​x counter = 0 rdd = sc . parallelize ( data ) def increment_counter ( x ): ...
  • 导入Kafka数据

    导入Kafka数据 环境配置 前提条件 操作步骤 步骤 1:在Nebula Graph中创建Schema 步骤 2:修改配置文件 步骤 3:向Nebula Graph导入数据 步骤 4:(可选)验证数据 步骤 5:(如有)在Nebula Graph中重建索引 导入Kafka数据 本文简单说明如何使用Exchange将存储在Kafka上的...
  • 异常诊断与调试

    异常诊断与调试 Alluxio日志地址 Alluxio远程调试 Alluxio部署常见问题 问题: 在本地机器上初次安装使用Alluxio失败,应该怎么办? 问题: 打算在Spark/HDFS集群中部署Alluxio,有什么建议? ALLuxio使用常见问题 问题:出现“No FileSystem for scheme: alluxio”这种错误信...
  • 对比

    对比 Kudu Hive事务 HBase 流式处理 对比 Apache Hudi填补了在DFS上处理数据的巨大空白,并可以和这些技术很好地共存。然而, 通过将Hudi与一些相关系统进行对比,来了解Hudi如何适应当前的大数据生态系统,并知晓这些系统在设计中做的不同权衡仍将非常有用。 Kudu Apache Kudu 是一个与Hudi具有...
  • 对比

    Kudu Hive事务 HBase 流式处理 Apache Hudi填补了在DFS上处理数据的巨大空白,并可以和这些技术很好地共存。然而, 通过将Hudi与一些相关系统进行对比,来了解Hudi如何适应当前的大数据生态系统,并知晓这些系统在设计中做的不同权衡仍将非常有用。 Kudu Apache Kudu 是一个与Hudi具有相似目标的存储系统...