一面:性能
1.讲一下索引文件同步这项工做?测试
1.1随机选定一台机器执行定时任务时,如何避免单点故障?线程
1.2选定机器是先构建索引再更新本地索引文件仍是边构建边更新?orm
1.3当选定的机器构建新索引后没有上传oss,有处理方式吗?(其余机器没办法更新索引文件了)索引
1.4其余机器从oss下载索引文件时的更新策略?(覆盖更新仍是先下载再更新)进程
2.讲一下用户画像这个项目。年龄、性别已是标签了,大家还须要处理什么吗?同步
3.storm程序的基本组成(spout和bolt)?定时任务
3.1storm如何保证数据正确处理?下载
3.2ack机制中bolt1如何确认bolt2正确接受到了数据?程序
3.3如今有这样一条处理链路:spout-->bolt1-->bolt2-->bolt3,一条数据过来,bolt2会等着bolt3发送ack后再bolt1发送ack仍是直接收到数据就发送ack?
4.flink性能测试是怎么作的?结果?主要关注哪些特性?flink的容错机制为何就比storm好?
3.进程和线程的区别?
4.TCP协议中客户端和服务端都会有哪些状态?
5.scoket写过吗?