precombine field hudi

医疗在线OLAP场景下基于Apache Hudi 模式演变的改造与应用

背景在 Apache Hudi支持完整的Schema演变的方案中（https://mp.weixin.qq.com/s/rSW864o2YEbHw6oQ4Lsq0Q），读取方面，只完成了SQL on Spark的支持（Spark3以上，用于离线分析场景），Presto（用于在线OLAP场景）及A ......

场景模式医疗 Apache OLAP更新时间 2023-03-22

大数据下一代变革之必研究数据湖技术Hudi原理实战双管齐下-中

本篇详细描述hoodie数据读写流程，进一步加深对数据湖技术的理解。理论后转战集成Spark的使用，通过spark-shell和spark-sql实现hoodie的插入数据、查询数据、更新数据、删除数据、覆盖数据、时间旅行查询等示例，了解创建表、修改表结构、查询分区、删除分区基本用法，为进一步使用奠... ......

数据双管齐下下一代实战原理更新时间 2023-03-22

大数据下一代变革之必研究数据湖技术Hudi原理实战双管齐下-下

本篇演示了Hudi集成Spark的Scala编程示例，并一步步操作说明如何使用DeltaStreamer从Kafka里读取数据写入到Hudi表的HDFS中，接着集成Flink的环境准备，通过基于yarn-session的Flink的sql-client方式提交任务实现插入数据和流式读取数据，了解字节... ......

数据双管齐下下一代实战原理更新时间 2023-03-22

大数据下一代变革之必研究数据湖技术Hudi原理实战双管齐下-后续

本篇实战Hudi集成Flink SQl编程示例实现从生成器表写入Hudi表，打包集群验证；然后通过Hudi Flink CDC实现采集MySQL binlog日志写入Kafka再入到hudi表的完整示例，了解Hudi Flink的基础调试只是，最后通过Hudi集成Hive实现Flink Hive C... ......

数据双管齐下下一代实战原理更新时间 2023-03-22

共124篇 :5/5页 首页上一页2345下一页尾页

526互联

precombine field hudi

医疗在线OLAP场景下基于Apache Hudi 模式演变的改造与应用

大数据下一代变革之必研究数据湖技术Hudi原理实战双管齐下-中

大数据下一代变革之必研究数据湖技术Hudi原理实战双管齐下-下

大数据下一代变革之必研究数据湖技术Hudi原理实战双管齐下-后续