Flink

Flink安装

Flink安装 下载并解压 f_v=1.14.4 mkdir -p /opt/software && cd /opt/software wget https://mirrors.bfsu.edu.cn/apache/flink/flink-${f_v}/flink-${f_v}-bin-scala_ ......
Flink

flink中配置kafka

Flink 提供了 Apache Kafka 连接器,用于从 Kafka topic 中读取或者向其中写入数据,可提供精确一次的处理语义。 一:简单使用 1.pom <!--Flink Connector KAFKA--> <dependency> <groupId>org.apache.flink ......
flink kafka

Flink与mysql结合

在流式计算中,不是有时候需要和mysql进行结合做一些处理。 1.调用其他方法进行 2.更快的处理 使用guava本地缓存 对msql的操作是new对象过来 private final static RuleService ruleService = new RuleService(); final ......
Flink mysql

《基于Apache Flink的流处理》Part2

Apache Flink 架构 搭建Flink所需组件 Flink 的搭建需要四个不同组件,它们相互协作,共同执行流式应用。这些组件是:JobManager、ResourceManager、TaskManager 和 Dispatcher。Flink 本身是用 Java 和 Scala 实现的,因此 ......
Apache Flink Part2 Part

《基于Apache Flink的流处理》Part1

流处理基础 DataFlow 图 Dataflow 程序描述了数据如何在不同操作之间流动。Dataflow 程序通常表示为有向图。图中顶点称为算子,表示计算;而边表示数据依赖关系。算子是Dataflow 程序的基本功能单元,它们从输入获取数据,对其进行计算,然后产生数据并发往输出以供后续处理。没有输 ......
Apache Flink Part1 Part

使用 Alluxio 优化 EMR 上 Flink Join

业务背景&痛点 流式处理的业务场景,经常会遇到实时消息数据需要与历史存量数据关联查询或者聚合,比如电商常见的订单场景,订单表做为实时事实表,是典型的流式消息数据,通常会在 kafka 中,而客户信息,商品 SKU 表是维度表,通常存在业务数据库或者数仓中,是典型的离线数据。实时订单数据在实时处理时通 ......
Alluxio Flink Join EMR

【博学谷学习记录】超强总结,用心分享 | 初识Flink

【博学谷IT技术支持】 介绍 Flink是由Apache软件基金会开发的开源流处理矿建,其核心是用JAVA和Scala编写的分布式流数据引擎。Flink以数据并行和流水线方式执行任意流数据程序,Flink的流水线运行时系统可以执行批处理和流处理程序,Flink的运行本身也支持迭代算法的执行。 Fli ......
Flink

Flink 自定义 SQL Connector

Flink 自定义 SQL Connector 1. 启程 flink 本身提供了丰富的 sql connector, 一般不需要用户自己定义。但是在某些特殊的情况下需要手动实现针对实际场景的 sql connector。 最近在实践中遇到了两个比较极端的场景, 无法通过简单的 sql connec ......
Connector Flink SQL

构建一个flink程序,从kafka读取然后写入MYSQL

最近flink已经变得比较流行了,所以大家要了解flink并且使用flink。现在最流行的实时计算应该就是flink了,它具有了流计算和批处理功能。它可以处理有界数据和无界数据,也就是可以处理永远生产的数据。具体的细节我们不讨论,我们直接搭建一个flink功能。总体的思路是source -> tra ......
程序 flink MYSQL kafka

大数据之—Flink环境搭建

前言 参考:https://blog.csdn.net/weixin_44385486/article/details/124197370 运行模式 local:单机模式,尽量不使用 standalone: flink自带集群,资源管理由flink集群管理,开发环境测试使用 flink on yar ......
环境 数据 Flink

Flink,Dinky踩坑日记

1. Flink使用 v 初始化配置 Dlinky初始化需要使用数据库,下载包中有数据库文件(mysql),dlinky和flink存在版本问题,注意插件包中scala对应的版本序号。如果版本不对应,在执行时会报异常debzum v MySql数据库配置:需要开启bin_log功能,先查看是否开启, ......
日记 Flink Dinky

Flink安装部署

一、Local本地模式 1、下载安装包 https://archive.apache.org/dist/flink/ 使用的版本为 flink-1.13.2-bin-scala_2.11.tgz 2、准备文件 vi /xx/work/words.txt 3、启动Flink本机集群 cd /xx/wo ......
Flink

Flink模式

Per-job Cluster 该模式下,一个作业一个集群,作业之间相互隔离。 在Per-Job模式下,集群管理器框架用于为每个提交的Job启动一个 Flink 集群。Job完成后,集群将关闭,所有残留的资源也将被清除。 此模式可以更好地隔离资源,因为行为异常的Job不会影响任何其他Job。另外,由 ......
模式 Flink

重磅!flink-table-store 将作为独立数据湖项目重新加入 Apache

数据湖是大数据近年来的网红项目,大家熟知的开源数据湖三剑客 Apache hudi、Apache iceberg 、Databricks delta 近年来野蛮生长,目前各自背后也都有商业公司支持,投入了大量的人力物力去做研发和宣传。然而今天我们要讲的是数据湖界的后起之秀 —— flink-tabl ......

基于FLink实现的实时安全检测(一段时间内连续登录失败20次后,下一次登录成功场景)

研发背景 公司安全部目前针对内部系统的网络访问日志的安全审计,大部分都是T+1时效,每日当天,启动Python编写的定时任务,完成昨日的日志审计和检测,定时任务运行完成后,统一进行企业微信告警推送。这种方案在目前的网络环境和人员规模下,呈现两个痛点,一是面对日益频繁的网络攻击、钓鱼链接,T+1的定时 ......
安全检测 实时 场景 时间 FLink

《关于我因为flink成为spark源码贡献者这件小事》

各位读者老爷请放下手上的板砖,我可真没有标题党,且容老弟慢慢道来。 spark和flink本身相信我不用做过多的介绍,后端同学不管搞没搞过大数据,应该都多多少少听过。 如果没听过,简单说,spark和flink之于大数据,就好比vue和react之于前端,就好比spring家族之于java。 从20 ......
贡献者 源码 小事 贡献 flink

Flink mini-batch "引发" 的乱序问题

问题描述 近期业务反馈, 开启了 mini-batch 之后, 出现了数据不准的情况, 关掉了 mini-batch 之后, 就正常了, 因此业务方怀疑,是不是 Flink 的 mini-batch 存在 bug ? 问题排查 初步分析 mini-batch 已经在内部大规模使用, 目前没有发现一例 ......
quot mini-batch 问题 Flink batch

Flink SQL管理平台flink-streaming-platform-web安装搭建

文章都在个人博客网站:https://www.ikeguang.com/ 同步,欢迎访问。 最近看到有人在用flink sql的页面管理平台,大致看了下,尝试安装使用,比原生的flink sql界面确实好用多了,我们看下原生的,通过bin/sql-client.sh命令进入那个黑框,一只松鼠,对,就 ......

Flink同步Kafka数据到ClickHouse分布式表

公众号文章都在个人博客网站:https://www.ikeguang.com/ 同步,欢迎访问。 业务需要一种OLAP引擎,可以做到实时写入存储和查询计算功能,提供高效、稳健的实时数据服务,最终决定ClickHouse。 什么是ClickHouse? ClickHouse是一个用于联机分析(OLAP ......
分布式 ClickHouse 数据 Flink Kafka
共229篇  :8/8页 首页上一页8下一页尾页