使用flume替代原有的scribe服務

發布時間：2020-06-14 06:21:29 來源：網絡閱讀：10013 作者：Slaytanic 欄目：大數據

以前很多業務都是用scribe做日志收集的支撐的，后來fb停止了對scribe的開發支持。而且scribe在機器上編譯一次的代價太大了，各種坑，正好后來flume從1.3.0開始加入了對scribe的支持。就可以把原來scribe上面接入的數據轉用flume收集了。雖然我很喜歡scribe，但是失去了官方支持畢竟還是很鬧心的。

agent.channels=c1
agent.channels.c1.capacity=20000
agent.channels.c1.transactionCapacity=10000
agent.channels.c1.type=memory
agent.sinks=k1
agent.sinks.k1.channel=c1
agent.sinks.k1.hdfs.batchSize=8000
agent.sinks.k1.hdfs.filePrefix=log
agent.sinks.k1.hdfs.fileType=DataStream
agent.sinks.k1.hdfs.path=hdfs://NNHA/data/flume/%{category}/%Y%m%d
agent.sinks.k1.hdfs.rollCount=0
agent.sinks.k1.hdfs.rollInterval=86400
agent.sinks.k1.hdfs.round=true
agent.sinks.k1.hdfs.roundUnit=minute
agent.sinks.k1.hdfs.roundValue=1
agent.sinks.k1.hdfs.serializer.appendNewline=false
agent.sinks.k1.hdfs.useLocalTimeStamp=true
agent.sinks.k1.hdfs.writeFormat=TEXT
agent.sinks.k1.type=hdfs
agent.sources=r1
agent.sources.r1.channels=c1
agent.sources.r1.host=0.0.0.0
agent.sources.r1.port=1463
agent.sources.r1.type=org.apache.flume.source.scribe.ScribeSource
agent.sources.r1.workerThreads=5

主要是serializer.appendNewline設置為false，否則會每條自動添加一個回車上去，其他也沒什么太多好解釋的，用過flume的自然秒懂，hdfs.path里面，%{category}就是意味著原來scribe里面的category。

flume 1.6的新特性里面是加入了對kafka的source和sink的支持，以及對數據內容的正則過濾傳遞，這點很有用，貌似下個月或者下下個月會有本關于flume的新書上市。

向AI問一下細節

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

使用flume替代原有的scribe服務

猜你喜歡

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

使用flume替代原有的scribe服務

猜你喜歡

最新資訊

相關推薦

相關標簽