javaapi iceberg impala flink

flink中配置kafka

Flink 提供了 Apache Kafka 连接器，用于从 Kafka topic 中读取或者向其中写入数据，可提供精确一次的处理语义。一：简单使用 1.pom  <dependency> <groupId>org.apache.flink ......

flink kafka更新时间 2023-04-01

Flink与mysql结合

在流式计算中，不是有时候需要和mysql进行结合做一些处理。 1.调用其他方法进行 2.更快的处理使用guava本地缓存对msql的操作是new对象过来 private final static RuleService ruleService = new RuleService(); final ......

Flink mysql更新时间 2023-04-01

《基于Apache Flink的流处理》Part2

Apache Flink 架构搭建Flink所需组件 Flink 的搭建需要四个不同组件，它们相互协作，共同执行流式应用。这些组件是：JobManager、ResourceManager、TaskManager 和 Dispatcher。Flink 本身是用 Java 和 Scala 实现的，因此 ......

Apache Flink Part2 Part更新时间 2023-03-30

《基于Apache Flink的流处理》Part1

流处理基础 DataFlow 图 Dataflow 程序描述了数据如何在不同操作之间流动。Dataflow 程序通常表示为有向图。图中顶点称为算子，表示计算；而边表示数据依赖关系。算子是Dataflow 程序的基本功能单元,它们从输入获取数据,对其进行计算,然后产生数据并发往输出以供后续处理。没有输 ......

Apache Flink Part1 Part更新时间 2023-03-30

使用 Alluxio 优化 EMR 上 Flink Join

业务背景&痛点流式处理的业务场景，经常会遇到实时消息数据需要与历史存量数据关联查询或者聚合，比如电商常见的订单场景，订单表做为实时事实表，是典型的流式消息数据，通常会在 kafka 中，而客户信息，商品 SKU 表是维度表，通常存在业务数据库或者数仓中，是典型的离线数据。实时订单数据在实时处理时通 ......

Alluxio Flink Join EMR更新时间 2023-03-29

Elasticsearch 学习-javaAPI操作

Elasticsearch 学习-javaAPI操作 ==Elasticsearch 软件是由 Java 语言开发的，所以也可以通过 Java API 的方式对 Elasticsearch服务进行访问== 2.2.5.1 创建 Maven 项目我们在 IDEA 开发工具中创建 Maven 项目(模 ......

Elasticsearch javaAPI更新时间 2023-03-27

【博学谷学习记录】超强总结，用心分享 | 初识Flink

【博学谷IT技术支持】介绍 Flink是由Apache软件基金会开发的开源流处理矿建，其核心是用JAVA和Scala编写的分布式流数据引擎。Flink以数据并行和流水线方式执行任意流数据程序，Flink的流水线运行时系统可以执行批处理和流处理程序，Flink的运行本身也支持迭代算法的执行。 Fli ......

Flink更新时间 2023-03-26

Flink 自定义 SQL Connector

Flink 自定义 SQL Connector 1. 启程 flink 本身提供了丰富的 sql connector, 一般不需要用户自己定义。但是在某些特殊的情况下需要手动实现针对实际场景的 sql connector。最近在实践中遇到了两个比较极端的场景, 无法通过简单的 sql connec ......

Connector Flink SQL更新时间 2023-03-24

构建一个flink程序,从kafka读取然后写入MYSQL

最近flink已经变得比较流行了，所以大家要了解flink并且使用flink。现在最流行的实时计算应该就是flink了，它具有了流计算和批处理功能。它可以处理有界数据和无界数据，也就是可以处理永远生产的数据。具体的细节我们不讨论，我们直接搭建一个flink功能。总体的思路是source -> tra ......

程序 flink MYSQL kafka更新时间 2023-03-24

大数据之—Flink环境搭建

前言参考：https://blog.csdn.net/weixin_44385486/article/details/124197370 运行模式 local:单机模式，尽量不使用 standalone: flink自带集群，资源管理由flink集群管理，开发环境测试使用 flink on yar ......

环境数据 Flink更新时间 2023-03-24

Flink，Dinky踩坑日记

1. Flink使用 v 初始化配置 Dlinky初始化需要使用数据库，下载包中有数据库文件(mysql)，dlinky和flink存在版本问题,注意插件包中scala对应的版本序号。如果版本不对应，在执行时会报异常debzum v MySql数据库配置：需要开启bin_log功能，先查看是否开启， ......

日记 Flink Dinky更新时间 2023-03-24

Flink安装部署

一、Local本地模式 1、下载安装包 https://archive.apache.org/dist/flink/ 使用的版本为 flink-1.13.2-bin-scala_2.11.tgz 2、准备文件 vi /xx/work/words.txt 3、启动Flink本机集群 cd /xx/wo ......

Flink更新时间 2023-03-22

Flink模式

Per-job Cluster 该模式下，一个作业一个集群，作业之间相互隔离。在Per-Job模式下，集群管理器框架用于为每个提交的Job启动一个 Flink 集群。Job完成后，集群将关闭，所有残留的资源也将被清除。此模式可以更好地隔离资源，因为行为异常的Job不会影响任何其他Job。另外，由 ......

模式 Flink更新时间 2023-03-22

重磅！flink-table-store 将作为独立数据湖项目重新加入 Apache

数据湖是大数据近年来的网红项目，大家熟知的开源数据湖三剑客 Apache hudi、Apache iceberg 、Databricks delta 近年来野蛮生长，目前各自背后也都有商业公司支持，投入了大量的人力物力去做研发和宣传。然而今天我们要讲的是数据湖界的后起之秀 —— flink-tabl ......

重磅 flink-table-store 项目数据 Apache更新时间 2023-03-22

基于FLink实现的实时安全检测（一段时间内连续登录失败20次后，下一次登录成功场景）

研发背景公司安全部目前针对内部系统的网络访问日志的安全审计，大部分都是T+1时效，每日当天，启动Python编写的定时任务，完成昨日的日志审计和检测，定时任务运行完成后，统一进行企业微信告警推送。这种方案在目前的网络环境和人员规模下，呈现两个痛点，一是面对日益频繁的网络攻击、钓鱼链接，T+1的定时 ......

安全检测实时场景时间 FLink更新时间 2023-03-22

Iceberg 数据治理及查询加速实践

数据治理 Flink 实时写入 Iceberg 带来的问题在实时数据源源不断经过 Flink 写入的 Iceberg 的过程中，Flink 通过定时的 Checkpoint 提交 snapshot commit 操作到 Iceberg，将已写入到 Iceberg 的数据文件通过 Snapshot ......

Iceberg 数据更新时间 2023-03-22

《关于我因为flink成为spark源码贡献者这件小事》

各位读者老爷请放下手上的板砖，我可真没有标题党，且容老弟慢慢道来。 spark和flink本身相信我不用做过多的介绍，后端同学不管搞没搞过大数据，应该都多多少少听过。如果没听过，简单说，spark和flink之于大数据，就好比vue和react之于前端，就好比spring家族之于java。从20 ......

贡献者源码小事贡献 flink更新时间 2023-03-22

Flink mini-batch "引发" 的乱序问题

问题描述近期业务反馈，开启了 mini-batch 之后，出现了数据不准的情况，关掉了 mini-batch 之后，就正常了，因此业务方怀疑，是不是 Flink 的 mini-batch 存在 bug ？问题排查初步分析 mini-batch 已经在内部大规模使用，目前没有发现一例 ......

quot mini-batch 问题 Flink batch更新时间 2023-03-22

Flink SQL管理平台flink-streaming-platform-web安装搭建

文章都在个人博客网站：https://www.ikeguang.com/ 同步，欢迎访问。最近看到有人在用flink sql的页面管理平台，大致看了下，尝试安装使用，比原生的flink sql界面确实好用多了，我们看下原生的，通过bin/sql-client.sh命令进入那个黑框，一只松鼠，对，就 ......

flink-streaming-platform-web streaming platform Flink flink更新时间 2023-03-22

Flink同步Kafka数据到ClickHouse分布式表

公众号文章都在个人博客网站：https://www.ikeguang.com/ 同步，欢迎访问。业务需要一种OLAP引擎，可以做到实时写入存储和查询计算功能，提供高效、稳健的实时数据服务，最终决定ClickHouse。什么是ClickHouse？ ClickHouse是一个用于联机分析(OLAP ......

分布式 ClickHouse 数据 Flink Kafka更新时间 2023-03-22

共260篇 :9/9页 首页上一页6789下一页尾页