Flink

Flink创建Hudi的Sink动态表

工厂类 HoodieTableFactory 提供的创建动态表接口 createDynamicTableSource 和 createDynamicTableSink，对应的源码文件为：https://github.com/apache/hudi/blob/master/hudi-flink-dat ......

动态 Flink Hudi Sink更新时间 2023-05-09

Hudi的Flink配置项（1）

名词 FallbackKeys 备选 keys，可理解为别名，当指定的 key 不存在是，则找备选 keys，在这里指配置项的名字。相关源码 FlinkOptions // https://github.com/apache/hudi/blob/master/hudi-flink-datasour ......

Flink Hudi更新时间 2023-05-09

启动flink显示ERROR: JAVA_HOME is not set and could not be found.

问题： JAVA_HOME存在，但启动flink时出现ERROR: JAVA_HOME is not set and could not be found. 原因：环境变量加载顺序不对 # /etc/profile.d/hadoop.sh # ... export HADOOP_CLASSPATH ......

JAVA_HOME not flink ERROR could更新时间 2023-05-09

flink Connecting to remote task manager 'localhost/127.0.0.1:44489

问题：启动集群后，执行任务时失败： Caused by: org.apache.flink.runtime.io.network.partition.consumer.PartitionConnectionException: Connection for partition 47d4a41224 ......

Connecting localhost manager remote flink更新时间 2023-05-08

Flink Cdc MySQL 整库同步到 StarRocks

这段时间开始调研使用 StarRocks 做准实时数据仓库：flink cdc 实时同步数据到 StarRocks，然后在 StarRocks 中做分层计算，直接把 StarRocks 中的 ADS 层提供给 BI 查询。架构如下：由于用到的表比较多，不能用 Flink SQL 给每个表都做个 C ......

StarRocks Flink MySQL Cdc更新时间 2023-05-06

Flink 1.17 自定义 MySQL Catalog

Catalog 类型以下内容来自官网： Hive Catalog 支持Flink 元数据的持久化存储，以前一直用 Hive Catalog 存，偶尔需要用的时候把 Hive Catalog 开启（需启动 hive metastore 和 hiveserver2，还要启动 Hadoop），大部分时候 ......

Catalog Flink MySQL 1.17 17更新时间 2023-05-06

【新鲜出炉的个人项目】基于 Flink 的商品推荐系统

Recs FlinkCommodityRecommendationSystem(基于 Flink 的商品推荐系统) 1. 前言系统取名为 Recs，灵感源于 Recommendation System。logo 使用在线 logo 网站制作。作者开发该项目，是为了学习 Flink 以及相关大数据中 ......

项目商品系统 Flink 个人更新时间 2023-05-05

flink平台项目-cnblog

# flink平台项目目录架构以前架构现在架构的说明 CDH&集群规模人员配备开发周期为什么用flinkcdc 项目好处千表入湖工具 flink操作hive flink集成hive的步骤 flinksql 数据源为kafka flink读写sql有两种模式 Temporal Joi ......

项目 cnblog flink 平台更新时间 2023-05-04

【flink】重启kafka消费者

public class KafkaConsumerJob { public static void main(String[] args) throws Exception { StreamExecutionEnvironment env = StreamExecutionEnvironment. ......

消费者 flink kafka更新时间 2023-04-23

flink学习路线

1 传统架构 2 大数据架构和流式架构的演变工程 3 flink优势和不足 4 flink应用场景 5 flink基本架构 6 环境准备，运行环境和开发环境配置，建议使用java，兼容性好 7 flink编程模型：flink的数据集类型，编程接口，程序结构和数据类型4个维度进行分析。流式处理和批量计 ......

路线 flink更新时间 2023-04-22

Flink启动报错：/bin/config.sh: line 32: syntax error near unexpected token

flink启动报错 xxx@ssss:/xxx/flink-1.15.2/bin> sh start-cluster.sh /xxx/flink-1.15.2/bin/config.sh: line 32: syntax error near unexpected token `<' /xxx/fl ......

unexpected config syntax Flink error更新时间 2023-04-21

单机单节点Flink的部署

一、Flink的下载和安装 1、Flink的下载官方下载网址：https://archive.apache.org/dist/flink/这里选择1.15.2这个版本 2、把Flink上传到主机上把下载好的文件上传到/opt/software上 3、解压Flink安装包把Flink解压到/op ......

节点单机 Flink更新时间 2023-04-21

Flink之基于EventTime的WaterMark

什么是FLink watermark? Flink watermark是一种用于时间和事件处理的机制，它为事件流中的每个事件都分配了一个时间戳，以便将其与其他事件进行排序和分组。Watermark还为每个事件流提供了一个智能定界框架，使Flink能够有效地控制事件流的处理方式。Watermark可以 ......

EventTime WaterMark Flink更新时间 2023-04-21

flink 消费多个topic

转：https://www.404bugs.com/details/1081256252897284096 flink 消费多个topic示例： import org.apache.flink.api.common.functions.FlatMapFunction; import org.apac ......

多个 flink topic更新时间 2023-04-20

flink taskmanager 初始化失败，报TaskManager initialization failed

【问题现象】报错1：报错2：【定位步骤】报错1是因为flink写日志的文件目录权限不够。为什么不够呢？因为该环境是admin部署，而flink的用户是自己创建的一个用户999，不是root用户，访问权限报错 --解决办法：在对应扩容脚本中增加日志目录的权限赋值，赋值为777 报错为taskm ......

initialization TaskManager taskmanager failed flink更新时间 2023-04-20

Flink

Flink 流处理与批处理最大不同在于数据传输方式：流处理：一条数据被处理完成后序列化到缓存，然后传输到下一个节点处理（一条一条）批处理：数据处理完成后缓存到内存，缓存写满后持久化硬盘，所有数据处理完成后再传输到下一个节点（一批一批） Flink以固定的缓存块为单位进行网络数据传输，用户可以通过 ......

Flink更新时间 2023-04-19

SchemaRegestry组件原生的类和方法无法实现flink消费kafka的数据动态调整schema的情况--未彻底解决

0、前提知识储备 Conflurent公司的SchemaRegestry组件的基本了解和使用一、背景： 0.组件版本 flink：1.14 1.链路调整情况原先链路：oracle-->OGG-->kafka-->flink-->数据库\湖\仓实现链路：oracle-->OGG-->kafka（ ......

SchemaRegestry 组件情况方法动态更新时间 2023-04-19

构建私有仓库 flink image 镜像

准备flink-*.tar.gz 可以自己编译，或者下载编译 cd ${flink-root} mvn install -DskipTests # 编译成功后，压缩成tar.gz cd ./flink-dist/target/ tar -cvf flink-1.18-SNAPSHOT-bin.ta ......

仓库镜像 flink image更新时间 2023-04-18

flink

指定TM内存模型的方式整个TM内存模型可以通过三种方式来指定通过指定 taskmanager.memory.task.heap.size 和 taskmanager.memory.managed.size来确定通过指定 taskmanager.memory.flink.size 也就是 Tota ......

flink更新时间 2023-04-17

[Flink] Flink作业报错：Caused by: The connector is trying to read binlog starting at GTIDs ..., but this is no longer available on the server[转载]

这个问题，属于偶现问题。通常几个月才偶现一次。因为上周五又出现了一次，且团队内多位小伙伴都遇到过。故此，这次特别记录下，以加强印象。 1 问题描述 Flink作业报错：Caused by: The connector is trying to read binlog starting at GTI ......

Flink available connector starting Caused更新时间 2023-04-17

共229篇 :7/8页 首页上一页45678下一页尾页

526互联

Flink

Flink创建Hudi的Sink动态表

Hudi的Flink配置项（1）

启动flink显示ERROR: JAVA_HOME is not set and could not be found.

flink Connecting to remote task manager 'localhost/127.0.0.1:44489

Flink Cdc MySQL 整库同步到 StarRocks

Flink 1.17 自定义 MySQL Catalog

【新鲜出炉的个人项目】基于 Flink 的商品推荐系统

flink平台项目-cnblog

【flink】重启kafka消费者

flink学习路线

Flink启动报错：/bin/config.sh: line 32: syntax error near unexpected token

单机单节点Flink的部署

Flink之基于EventTime的WaterMark

flink 消费多个topic

flink taskmanager 初始化失败，报TaskManager initialization failed

Flink

SchemaRegestry组件原生的类和方法无法实现flink消费kafka的数据动态调整schema的情况--未彻底解决

构建私有仓库 flink image 镜像

flink

[Flink] Flink作业报错：Caused by: The connector is trying to read binlog starting at GTIDs ..., but this is no longer available on the server[转载]

Flink零基础学习笔记(一)：基础概念

记一次Flink遇到性能瓶颈

初学Flink上传jar包出现报错Internal server error.---No data for required key 'port'

分布式计算技术（下）：Impala、Apache Flink、星环Slipstream

flink？

【博学谷学习记录】超强总结，用心分享 | Flink的编程

【博学谷学习记录】超强总结，用心分享 | Flink的安装部署

Flink 生成ParquetFile

详解 Flink Catalog 在 ChunJun 中的实践之路

A6--Flink部署