书栈网 · BookStack 本次搜索耗时 0.033 秒,为您找到 1513 个相关结果.
  • Release 0.55

    Release 0.55 RC Binary 2-4x Gain in CPU Efficiency Hash Distributed Aggregations Simple Distinct Aggregations Range Predicate Pushdown json_array_get Function Non-reserved Key...
  • 外部数据集

    外部数据集 外部数据集 Spark 可以从任何一个 Hadoop 支持的存储源创建分布式数据集,包括你的本地文件系统,HDFS,Cassandra,HBase,Amazon S3 等。 Spark 支持文本文件(text files),SequenceFiles 和其他 Hadoop InputFormat 。 文本文件 RDDs 可以使用 Sp...
  • Tables

    Overview of Impala Tables Internal Tables External Tables File Formats Kudu Tables Overview of Impala Tables Tables are the primary containers for data in Impala. They have...
  • 定义外部表

    定义外部表 定义外部表 E外部表允许把外部文件当作常规数据库表来访问。它们常常被用来把数据移进或者移出Greenplum数据库。 要创建一个外部表定义,用户需要指定输入文件的格式以及外部数据源的位置。有关输入文件格式的信息, 请参考 格式化数据文件 。 使用下列协议之一来访问外部表数据源。用户不能在CREATE EXTERNAL TABLE语句中...
  • DataX doriswriter

    DataX doriswriter 关于 DataX 使用手册 目录结构 编译 示例 DataX doriswriter DataX (opens new window) doriswriter 插件,用于通过 DataX 同步其他数据源的数据到 Doris 中。 这个插件是利用Doris的Stream Load 功能进行数据导入的。需要...
  • Release 0.55

    Release 0.55 RC Binary 2-4x Gain in CPU Efficiency Hash Distributed Aggregations Simple Distinct Aggregations Range Predicate Pushdown json_array_get Function Non-reserved Key...
  • 如何测试

    如何测试 测试 v1.5 及以上 更多关于 V1.5 UT/IT 分离 Cube 配置 如何测试 一般来说,应该有单元测试来涵盖个别 classes;必须有集成测试来涵盖端到端的场景,如构建,合并和查询。单元测试必须独立运行(不需要外部沙箱)。 测试 v1.5 及以上 mvn clean test 运行单元测试,它的测试覆盖范围有限。...
  • InLong Introduction

    InLong Introduction About InLong Features Architecture Modules Supported Data Nodes (Updating) InLong Introduction InLong (应龙) is a divine beast in Chinese mythology who g...
  • Release 0.55

    Release 0.55 RC Binary 2-4x Gain in CPU Efficiency Hash Distributed Aggregations Simple Distinct Aggregations Range Predicate Pushdown json_array_get Function Non-reserved Key...
  • 第十四章 数据采集与爬虫

    5654 2018-04-11 《大数据实验手册》
    第十八章 数据采集与爬虫 一 数据采集概念 1 Apache Flume 2、Fluentd 3 Logstash 4 数据采集总结 二 爬虫技术方案选择 1 分布式爬虫 2 JAVA单机爬虫 3 非JAVA单机爬虫 三 基于Python的爬虫库 1 通用 2 异步 3 功能齐全的爬虫 4 其他 5 HTML/XML解析器 6 清...