flume實時收集日誌到kafka

2021-09-30 13:37:41 字數 2173 閱讀 7572

flume實時收集日誌

kafka版本0.8.2

1.版本apache-flume-1.7.0-bin.tar.gz

解壓後conf 目錄下配置以.conf結尾的檔案如(flume_properties.conf)

2.配置檔案資訊

// sources 資料來源每增加乙個新增即可

a1.sources  =  r1 r2 r3 r4 r5

//資料輸出方式

a1.sinks  =  k1

//資料匯聚儲存方式

a1.channels  =  c1

//收集資料型別 exec為監控輸出檔案

a1.sources.r1.type  = exec

//檔案的路徑

a1.sources.r1.command=tail -f apache-tomcat-0/logs/catalina.2017-03-08.out

//增加每乙個資料來源都需要配置

a1.sources.r2.type  = exec

a1.sources.r2.command=tail -f apache-tomcat-1/logs/catalina.2017-03-08.out

a1.sources.r3.type  = exec

a1.sources.r3.command=tail -f apache-tomcat-2/logs/catalina.2017-03-08.out

a1.sources.r4.type  = exec

a1.sources.r4.command=tail -f apache-tomcat-3/logs/catalina.2017-03-08.out

a1.sources.r5.type  = exec

a1.sources.r5.command=tail -f apache-tomcat-4/logs/catalina.2017-03-08.out

//資料輸出型別

a1.sinks.k1.type= org.apache.flume.sink.kafka.kafkasink

//kafka位址

a1.sinks.k1.brokerlist=0.0.0.1:9092

//topic

a1.sinks.k1.topic=logs

//資料型別

a1.sinks.k1.serializer.class=kafka.serializer.stringencoder

//通道型別(記憶體)

a1.channels.c1.type  =  memory

//容量

a1.channels.c1.capacity  =  1000 

//event事務容量

a1.channels.c1.transactioncapacity  =  100

//資料來源使用的通道

a1.sources.r1.channels  =  c1

a1.sources.r2.channels  =  c1

a1.sources.r3.channels  =  c1

a1.sources.r4.channels  =  c1

a1.sources.r5.channels  =  c1

//sinks輸出的通道

a1.sinks.k1.channel  =  c1

3.啟動flume 

bin/flume-ng agent --conf conf --conf-file /home/flume/conf/flume_properties.conf  --name a1 -dflume.root.logger=info,console &

logger列印啟動日誌資訊

增加 & 在後台啟動 退出shell時注意 輸入exit 關閉連線

4.每日檔名變更

日誌檔案會按日期分割,sources的監控的檔案也會變化.

shell指令碼:(flumeupdate.sh)

#!/bin/bash

dateformattype=$(date +%y-%m-%d)

sed-i

's/catalina.*/catalina.'$'.out/g'

/home/flume/conf/flume_properties.conf

crontab任務:

0 5 * * * sh /home/x-sh/flumeupdate.sh

從flume到kafka,日誌收集

實時日誌分析 本篇文章主要測試 從flume到kafka的日誌收集,storm日誌分析,學習中!flume 配置檔案 collector collector.sources cs collector.sinks ck hbasesink collector.channels cc hbasechan...

FLUME日誌收集

flume是乙個分布式 可靠 和高可用的海量日誌聚合的系統,支援在系統中定製各類資料傳送方,用於收集資料 同時,flume提供對資料進行簡單處理,並寫到各種資料接受方 可定製 的能力。1 可靠性 當節點出現故障時,日誌能夠被傳送到其他節點上而不會丟失。flume提供了三種級別的可靠性保障,從強到弱依...

日誌收集 Flume

乙個flume程序就是乙個agent source channel sink 在source channel sink之間流動的是list exent event header byte payload,一般header是空的,傳輸資料的單位 flume串聯的壞處 乙個壞了全壞 好處 多級緩衝 處理...