书栈网 · BookStack 本次搜索耗时 0.037 秒,为您找到 165653 个相关结果.
  • 理解概念

    1951 2018-07-21 《Yarn学习笔记》
    yarn:/jɑːn/,纱线,奇谈,故事。 Yarn为Node.js平台的代码包管理器。类似于知名的npm包管理器,实际是npm客户端。 特点:快速、安全、可靠。1、离线模式:依赖包只要被装过一次,就会被缓存到本机,再次安装时直接从缓存中读取。2、高确定性:无论安装顺序如何,同样的依赖包都将会以完全一样的方式安装。3、网络性能优异:将请求高效队列化...
  • 数据格式 - Data formats

    permalink: data-formats.html 数据格式 日期与时间 基本显示 使用相对的词语和大致的时间 模块化 保持简洁 layout: pagetitle: 数据格式 permalink: data-formats.html 数据格式 用具有一致性且对用户友好的方式展示如日期时间这样的数据. 确保呈现的信息是简洁的...
  • 流处理

    流处理 流处理的应用 复合事件处理 流分析 维护物化视图 在流上搜索 消息传递和RPC 时间推理 事件时间与处理时间 知道什么时候准备好了 你用的是谁的时钟? 窗口的类型 流式连接 流流连接(窗口连接) 流表连接(流扩展) 表表连接(维护物化视图) 连接的时间依赖性 容错 微批量与存档点 原子提交再现 幂等性 失败后重建...
  • 使用案例

    使用案例 近实时摄取 近实时分析 增量处理管道 DFS的数据分发 使用案例 以下是一些使用Hudi的示例,说明了加快处理速度和提高效率的好处 近实时摄取 将外部源(如事件日志、数据库、外部源)的数据摄取到Hadoop数据湖 是一个众所周知的问题。 尽管这些数据对整个组织来说是最有价值的,但不幸的是,在大多数(如果不是全部)Hadoop部...
  • 使用案例

    使用案例 近实时摄取 近实时分析 增量处理管道 DFS的数据分发 使用案例 以下是一些使用Hudi的示例,说明了加快处理速度和提高效率的好处 近实时摄取 将外部源(如事件日志、数据库、外部源)的数据摄取到Hadoop数据湖 是一个众所周知的问题。 尽管这些数据对整个组织来说是最有价值的,但不幸的是,在大多数(如果不是全部)Hadoop部...
  • 使用案例

    使用案例 近实时摄取 近实时分析 增量处理管道 DFS的数据分发 使用案例 以下是一些使用Hudi的示例,说明了加快处理速度和提高效率的好处 近实时摄取 将外部源(如事件日志、数据库、外部源)的数据摄取到Hadoop数据湖 是一个众所周知的问题。 尽管这些数据对整个组织来说是最有价值的,但不幸的是,在大多数(如果不是全部)Hadoop部...
  • 十二、为什么均值重要

    十二、为什么均值重要 均值的性质 基本性质 均值是个“平滑器” 均值的性质 均值和直方图 均值和中位数 示例 可变性 距离均值的偏差的大致大小 标准差 使用 SD 使用 SD 度量延展度的最主要原因 切比雪夫边界 标准单位 示例 标准差和正态曲线 数据的大致钟形的直方图 如何定位钟形曲线上的 SD 标准正态曲线 标准正态的...
  • Milvus 简介

    Milvus 简介 Milvus 是什么 主要特性 整体架构 接下来您可以 Milvus 简介 Milvus 是什么 Milvus 是一款分布式特征向量检索引擎,旨在帮助用户实现十亿级特征向量的近似检索和分析。 主要特性 GPU 加速搜索系统 Milvus 使用 CPU/GPU 异构众核计算处理特征向量,在查询速度上可超出传统数...
  • 使用案例

    近实时摄取 近实时分析 增量处理管道 DFS的数据分发 近实时摄取 将外部源(如事件日志、数据库、外部源)的数据摄取到Hadoop数据湖 是一个众所周知的问题。 尽管这些数据对整个组织来说是最有价值的,但不幸的是,在大多数(如果不是全部)Hadoop部署中都使用零散的方式解决,即使用多个不同的摄取工具。 对于RDBMS摄取,Hudi提供 通过...
  • at 在指定时间执行一个任务

    at 补充说明 语法 选项 参数 实例 at 在指定时间执行一个任务 补充说明 at命令 用于在指定时间执行命令。at允许使用一套相当复杂的指定时间的方法。它能够接受在当天的hh:mm(小时:分钟)式的时间指定。假如该时间已过去,那么就放在第二天执行。当然也能够使用midnight(深夜),noon(中午),teatime(饮茶时间,一...