Apache Kylin4 分布式的分析型数据仓库

发布时间 2023-11-17 15:17:01作者: GaoYanbing

https://kylin.apache.org/cn/docs/index.html

Apache Kylin4 概述

欢迎来到 Apache Kylin™

Analytical Data Warehouse for Big Data

Apache Kylin™是一个开源的、分布式的分析型数据仓库,提供 Hadoop 之上的 SQL 查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay Inc.开发并贡献至开源社区。

查看其它版本文档:
v3.1 document
v2.4 document
归档

Apache Kylin4.0 是 Apache Kylin3.x 之后一次重大的版本更新,它采用了全新的 Spark 构建引擎和 Parquet 作为存储,同时使用 Spark 作为查询引擎。

Apache Kylin4.0 的第一个版本 kylin4.0.0-alpha 于 2020 年 7 月份发布,此后相继发布 kylin4.0.0-beta 以及正式版本。

为了方便用户对 Kylin4.x 有更全面更深层的了解,本篇文档会着重从 Kylin4.x 与之前版本有何异同的角度对 Kylin4.x 做全面概述。文章分为以下几个部分:

    • 为什么选择 Parquet 替换 HBase
    • 预计算结果在 Kylin4.0 中如何存储
    • Kylin 4.0 的构建引擎
    • Kylin 4.0 的查询引擎
    • Kylin4.0 与 Kylin3.1 功能对比
    • Kylin 4.0 性能表现
    • Kylin 4.0 查询和构建调优
    • Kylin 4.0 用户案例