大数据之—Flume环境搭建

发布时间 2023-03-22 21:13:26作者: 黄河大道东

前言

参考:https://blog.csdn.net/huxili2020/article/details/120212162?spm=1001.2014.3001.5502

软件仓库:https://archive.apache.org/dist/flume/

软件:https://archive.apache.org/dist/flume/1.7.0/apache-flume-1.7.0-bin.tar.gz

一、安装

mkdir -p /opt/flume

mv apache-flume-1.7.0-bin.tar.gz /opt/flume/

tar -zxf /opt/flume/apache-flume-1.7.0-bin.tar.gz

二、配置

cp /opt/flume/apache-flume-1.7.0-bin/conf/flume-env.sh.template /opt/flume/apache-flume-1.7.0-bin/conf/flume-env.sh

vim /opt/flume/apache-flume-1.7.0-bin/conf/flume-env.sh
# export JAVA_HOME=/opt/jdk/java8

二、简单使用示例

yum install -y nc netcat
mkdir -p /opt/flume/job && cd /opt/flume/job

vim /opt/flume/job/netcat-flume-logger.conf

# 给代理上的组件命名  a1:表示agent的名称
# r1:表示a1的Source的名称
a1.sources = r1
# k1:表示a1的Sink的名称
a1.sinks = k1
# c1: 表示a1的Channel的名称
a1.channels = c1

# 描述/配置源
# 表示a1的输入源类型为netcat端口类型
a1.sources.r1.type = netcat
# 表示a1的监听的主机
a1.sources.r1.bind = localhost
# 表示a1的监听的端口号
a1.sources.r1.port = 44444

# 描述接收器
# 表示a1的输出目的地是控制台logger类型
a1.sinks.k1.type = logger

# 使用在内存中缓冲事件的通道
# 表示a1的channel类型是memory内存型
a1.channels.c1.type = memory
# 表示a1的channel总容量为1000个event
a1.channels.c1.capacity = 1000
# 表示a1的channel传输时收集到了100条event以后再去提交事务
a1.channels.c1.transactionCapacity = 100

# 将 source 和 sink 绑定到 channel
# 表示将r1和c1连接起来
a1.sources.r1.channels = c1
# 表示将k1和c1连接起来
a1.sinks.k1.channel = c1

测试-输出到控制台

/opt/flume/apache-flume-1.7.0-bin/bin/flume-ng agent --conf /opt/flume/apache-flume-1.7.0-bin/conf/ --name a1 --conf-file /opt/flume/job/netcat-flume-logger.conf -Dflume.root.logger=INFO,console