type:source的类型,必须是netcat。app
bind:要监听的(本机的)主机名或者ip。此监听不是过滤发送方。一台电脑不是说只有一个IP。有多网卡的电脑,对应多个IP。负载均衡
port:绑定的本地的端口。tcp
type:avrosource的类型,必须是avro。spa
bind:要监听的(本机的)主机名或者ip。此监听不是过滤发送方。一台电脑不是说只有一个IP。有多网卡的电脑,对应多个IP。日志
port:绑定的本地的端口。code
type:source的类型:必须是exec。blog
command:要执行命令。事务
type:source 的类型:必须是spooldirip
spoolDir:监听的文件夹 【提早建立目录】内存
fileSuffix:上传完毕后文件的重命名后缀,默认为.COMPLETED
deletePolicy:上传后的文件的删除策略never和immediate,默认为never。
fileHeader:是否要加上该文件的绝对路径在header里,默认是false。
basenameHeader:是否要加上该文件的名称在header里,默认是false。
type:sink的类型 必须是hdfs。
hdfs.path:hdfs的上传路径。
hdfs.filePrefix:hdfs文件的前缀。默认是:FlumeData
hdfs.rollInterval:间隔多久产生新文件,默认是:30(秒) 0表示不以时间间隔为准。
hdfs.rollSize:文件到达多大再产生一个新文件,默认是:1024(bytes)0表示不以文件大小为准。
hdfs.rollCount:event达到多大再产生一个新文件,默认是:10(个)0表示不以event数目为准。
hdfs.batchSize:每次往hdfs里提交多少个event,默认为100
hdfs.fileType:hdfs文件的格式主要包括:SequenceFile, DataStream ,CompressedStream,若是使用了CompressedStream就要设置压缩方式。
hdfs.codeC:压缩方式:gzip, bzip2, lzo, lzop, snappy
注:%{host}能够使用header的key。以及%Y%m%d来表示时间,但关于时间的表示须要在header里有timestamp这个key。
要在控制台显示在运行agent的时候加入:-Dflume.root.logger=INFO,console 。
type:sink的类型:必须是 logger。
maxBytesToLog:打印body的最长的字节数 默认为16
type:sink的类型:必须是 avro。
hostname:指定发送数据的主机名或者ip
port:指定发送数据的端口
type:sink的类型:必须是 file_roll。
sink.directory:存储文件的目录【提早建立目录】
batchSize:一次发送多少个event。默认为100
sink.rollInterval:多久产生一个新文件,默认为30s。单位是s。0为不产生新文件。【即便没有数据也会产生文件】
Type channel的类型:必须为memory
capacity:channel中的最大event数目
transactionCapacity:channel中容许事务的最大event数目
Type channel的类型:必须为 file
checkpointDir :检查点的数据存储目录【提早建立目录】
dataDirs :数据的存储目录【提早建立目录】
transactionCapacity:channel中容许事务的最大event数目
Type channel的类型:必须为SPILLABLEMEMORY
memoryCapacity:内存的容量event数
overflowCapacity:数据存到文件的event阀值数
checkpointDir:检查点的数据存储目录
dataDirs:数据的存储目录
type:拦截器的类型,必须为timestamp
preserveExisting:若是此拦截器增长的key已经存在,若是这个值设置为true则保持原来的值,不然覆盖原来的值。默认为false
type:拦截器的类型,必须为host
preserveExisting:若是此拦截器增长的key已经存在,若是这个值设置为true则保持原来的值,不然覆盖原来的值。默认为false
useIP:若是设置为true则使用ip地址,不然使用主机名,默认为true
hostHeader:使用的header的key名字,默认为host
type:avrosource的类型,必须是static。
preserveExisting:若是此拦截器增长的key已经存在,若是这个值设置为true则保持原来的值,不然覆盖原来的值。默认为false
key:静态拦截器添加的key的名字
value:静态拦截器添加的key对应的value值
selector.type 默认为replicating
selector.header:选择做为判断的key
selector.default:默认的channel配置
selector.mapping.*:匹配到的channel的配置
负载均衡
a1.sinkgroups=g1
a1.sinkgroups.g1.sinks=k1 k2
a1.sinkgroups.g1.processor.type=load_balance
a1.sinkgroups.g1.processor.backoff=true
a1.sinkgroups.g1.processor.selector=round_robin
a1.sinkgroups.g1.processor.selector.maxTimeOut=30000
backoff:开启后,故障的节点会列入黑名单,过必定时间再次发送,若是还失败,则等待是指数增加;直到达到最大的时间。
若是不开启,故障的节点每次都会被重试。
selector.maxTimeOut:最大的黑名单时间(单位为毫秒)。
故障转移
a1.sinkgroups=g1
a1.sinkgroups.g1.sinks=k1 k2
a1.sinkgroups.g1.processor.type=failover
a1.sinkgroups.g1.processor.priority.k1=10
a1.sinkgroups.g1.processor.priority.k2=5
a1.sinkgroups.g1.processor.maxpenalty=10000
#maxpenalty 对于故障的节点最大的黑名单时间 (in millis 毫秒)