脸上长痤疮怎么办:Flume学习4

flume是一个海量日志采集聚合,传輸的系统

修改JAVA_HOME为本机的jdk安装目录即可

flume通过读取按照一定规则写好的配置文件,来启动agent进行传输,每一行数据被封装成一个event

举例介绍配置文件的写法

1监听一个文件夹,并将文件夹中新增内容输出到控制台(屏幕)


    


保存退出然后启动agent:


    

2,监听一个文件夹将其下新增文件上传到hdfs上。


    

保存退出然后启动agent:

 

然后可以在本地文件夹下新增文件,flume就按照指定的规则上传到hdfs上
}

第1节 flume:4、离线项目处理的整个架構图

在一个完整的离线大数据处理系统中除了hdfs+mapreduce+hive组成分析系统的核心之外,还需要数据采集、结果数据导出、任务调度等不可或缺的辅助系统而这些辅助工具在hadoop生态体系中都有便捷的开源框架,如图所示:

u  Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系統

u  Flume可以采集文件,socket数据包、文件、文件夹、kafka等各种形式源数据又可以将采集到的数据(下沉sink)输出到HDFS、hbase、hive、kafka等众多外部存储系统中

u  一般的采集需求,通过对flume的简单配置即可实现

u  Flume针对特殊场景也具备良好的自定义扩展能力

因此,flume可以适用于大部分的日常数据采集场景

1、  Flume分布式系统中最核心的角色是agentflume采集系统就是由一个个agent所连接起来形成

2、 每一个agent相当于一个数据传递员 ,内部有三个组件:

单个agent采集数据

多级agentの间串联

}

我要回帖

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信