解决策略:html
一、异步方式缓冲区满了,就阻塞在那,等着缓冲区可用,不能清空缓冲区缓存
二、发送消息以后回调函数,发送成功就发送下一条,安全
发送失败就记在日志里,等着定时脚本(定时器)来扫描异步
(发送失败可能并不真的发送失败,只是没收到反馈,定时脚本可能会重发)函数
如何保证有序(同步发送能保证顺序):日志
同步发送模式:发出消息后,必须阻塞等待收到通知后,才发送下一条消息htm
异步发送模式:一直往缓冲区写,而后一把写到队列中去blog
二者都是各有利弊:队列
同步发送模式虽然吞吐量小,可是发一条收到确认后再发下一条,既能保证不丢失消息,又能保证顺序get
kafka数据丢失缘由:
有3种状态(0(不须要等待确认)、1(leader确认)、-1(all确认))保证消息被安全生产,
在配置状态为1(只保证写入leader成功的话),若是恰好leader partition挂了,数据就会丢失
使用异步模式的时候,当缓存区满了,
若是配置状态为0(还没收到确认的状况下,缓冲池一满,就清空缓冲池里的消息),数据就会被立马丢弃掉
若是配置状态为-1
因为ISR可能会缩小到仅包含一个Replica,因此设置参数为all并不能必定避免数据丢失
在数据生产时避免数据丢失的方法: