若是你在准备面试,就好好看看这130道题

这些题目是一个知识星球的球友发给个人,其中有几个题帮着解答了一下。但愿对你们有帮助。
若是你不知道如何准备面试,那么看看这个。html

年假立刻来临,我相信有很多读者都在准备或者考虑面试,不管如何不妨收藏一下。java

若是你某个题目不知道答案,那么就去搜一下,若是搜不到,在公众号回复【加群】,能够加到群里寻求小伙伴们的求助。或者扫最下面的二维码加小助手好友并留言,有时间后我会回复你。mysql

顺便多提一句,计算机基础和语言基础请你们务必重视,若是你不是计算机专业,那么这些东西都要平时多看看。面试

这130个题暂时没有答案,不少题目《大数据技术与架构》都发过文章讲解过,须要你本身去准备,去看,去思考,真正理解。不要妄想别人喂给你,毕竟咱们是人不是鸭子。sql

一、HashMap 和 Hashtable 区别
二、Java 垃圾回收机制和生命周期
三、怎么解决 Kafka 数据丢失的问题
四、zookeeper 是如何保证数据一致性的
五、hadoop 和 spark 在处理数据时,处理出现内存溢出的方法有哪些?
六、java 实现快速排序
七、设计微信群发红包数据库表结构(包含表名称、字段名称、类型)
八、如何选型:业务场景、性能要求、维护和扩展性、成本、开源活跃度
九、Spark如何调优
十、Flink和spark的通讯框架有什么异同
十一、Java的代理
十二、Java的内存溢出和内存泄漏
1三、hadoop 的组件有哪些?Yarn的调度器有哪些?
1四、hadoop 的 shuffle 过程
1五、简述Spark集群运行的几种模式
1六、RDD 中的 reducebyKey 与 groupByKey 哪一个性能高?
1七、简述 HBase 的读写过程
1八、在 2.5亿个整数中,找出不重复的整数,注意:内存不足以容纳 2.5亿个整数。
1九、CDH 和 HDP 的区别
20、Java原子操做
2一、Java封装、继承和多态
2二、JVM 模型
2三、Flume taildirSorce 重复读取数据解决方法
2四、Flume 如何保证数据不丢
2五、Java 类加载过程
2六、Spark Task 运行原理
2七、手写一个线程安全的单例
2八、设计模式
2九、impala 和 kudu 的适用场景,读写性能如何
30、Kafka ack原理
3一、phoenix 建立索引的方式及区别
3二、Flink TaskManager 和 Job Manager 通讯
3三、Flink 双流 join方式
3四、Flink state 管理和 checkpoint 的流程
3五、Flink 分层架构
3六、Flink 窗口
3七、Flink watermark 如何处理乱序数据
3八、Flink time
3九、Flink支持exactly-once 的 sink 和 source
40、Flink 提交做业的流程
4一、Flink connect 和 join 区别
4二、重启 task 的策略
4三、hive 的锁
4四、hive sql 优化方式
4五、hadoop shuffle 过程和架构
4六、如何优化 shuffle过程
4七、冒泡排序和快速排序
4八、讲讲Spark的stage
4九、spark mkrdd和Parrallilaze函数区别
50、Spark checkpoint 过程
5一、二次排序
5二、如何注册 hive udf
5三、SQL去重方法
5四、Hive分析和窗口函数
5五、Hadoop 容错,一个节点挂掉而后又上线
5六、掌握 JVM 原理
5七、Java 并发原理
5八、多线程的实现方法
5九、RocksDBStatebackend实现(源码级别)
60、HashMap、ConcurrentMap和 Hashtable 区别
6一、Flink Checkpoint 是怎么作的,做用到算子仍是chain
6二、Checkpoint失败了的监控
6三、String、StringBuffer和 StringBuilder的区别
6四、Kafka存储流程,为何高吞吐?
6五、Spark优化方法举例
6六、keyby的最大并行度
6七、Flink 优化方法
6八、Kafka ISR 机制
6九、Kafka partition的4个状态
70、Kafka 副本的7个状态
7一、Flink taskmanager的数量
7二、if 和 switch 的性能及 switch 支持的参数
7三、kafka 零拷贝
7四、hadoop 节点容错机制
7五、HDFS 的副本分布策略
7六、Hadoop面试题汇总,大概都在这里(https://www.cnblogs.com/gala1...
7七、Kudu 和Impala 权限控制
7八、Time_wait状态?当server处理完client的请求后马上closesocket此时会出现time_wait状态.
7九、三次握手交换了什么? (SYN,ACK,SEQ,窗口大小)
3次握手创建连接,4次握手断开连接。
80、hashmap 1.7和1.8 的区别
8一、concurrenthashmap 1.7和1.8?
8二、Kafka 的ack
8三、sql 去重方法(group by 、distinct、窗口函数)
8四、哪些 Hive sql 不能在 Spark sql 上运行,看这里:https://spark.apache.org/docs...
8五、什么状况下发生死锁
8六、事务隔离级别? 可重复读、不可重复读、读未提交、串行化
8七、Spark shuffle 和 Hadoop shuffle的异同
8八、Spark静态内存和动态内存
8九、mysql btree 和 hash tree 的区别。btree 须要惟一主键,hash tree 适合>= 等,精确匹配,不适合范围检索
90、udf、udtf和 udaf 的区别
9一、hive sql 的执行过程
9二、client 端,spark sql 的执行过程
9三、找出数组中最长的top10字符串
9四、Flink 数据处理流程
9五、Flink 与 Spark streaming 对比
9六、Flink watermark 使用
9七、窗口与流的结合
9八、Flink 实时告警设计
9九、Java:面向对象、容器、多线程、单例
100、Flink:部署、API、状态、checkpoint、savepoint、watermark、重启策略、datastream 算子和优化、job和task状态
10一、Spark:原理、部署、优化
10二、Kafka:读写原理、使用、优化
10三、hive的外部表
10四、spark的函数式编程
10五、线性数据结构和数据结构
10六、Spark映射,rdd。
10七、java的内存溢出和内存泄漏。
10八、多线程的实现方法
10九、HashMap、ConcurrentMap和 Hashtable 区别
1十、Flink Checkpoint 是怎么作的,做用到算子仍是chain
1十一、Checkpoint失败了的监控
1十二、String、StringBuffer和 StringBuilder的区别
11三、Kafka存储流程,为何高吞吐
11四、Spark 优化方法举例
11五、keyby 的最大并行度
11六、Flink 优化方法
11七、kafka isr 机制
11八、kafka partition 的 4个状态
11九、kafka 副本的 7个状态
120、taskmanager 的数量
12一、if 和 switch 的性能
12二、Hdfs读写流程(结合cap理论讲)
12三、技术选型原则
12四、Kafka组件介绍
12五、g1和cms的区别
12六、熟悉的数据结构
12七、spark oom处理方法
12八、看了哪些源码
12九、Spark task原理
130、解决过的最有挑战的问题
13一、Hbase读写流程数据库

若是这130个题目有30个以上答不上来,面壁思过吧。apache

关注个人公众号,后台回复【JAVAPDF】获取200页面试题!
5万人关注的大数据成神之路,不来了解一下吗?
5万人关注的大数据成神之路,真的不来了解一下吗?
5万人关注的大数据成神之路,肯定真的不来了解一下吗?编程

欢迎您关注《大数据成神之路》

大数据技术与架构

相关文章
相关标签/搜索