Java和大数据架构师面试通关要点

原文又梁桂钊编写,我的新增了大数据部分面试以及部分Java语言基础java

简历篇

  • 请自我介绍
  • 请介绍项目

基础篇

基本功

面向对象的特征 final, finally, finalize 的区别 int 和 Integer 有什么区别 重载和重写的区别 抽象类和接口有什么区别 说说反射的用途及实现 说说自定义注解的场景及实现 HTTP 请求的 GET 与 POST 方式的区别 session 与 cookie 区别 session 分布式处理 JDBC 流程 MVC 设计思想 equals 与 == 的区别面试

集合

List 和 Set 区别 List 和 Map 区别 Arraylist 与 LinkedList 区别 ArrayList 与 Vector 区别 HashMap 和 Hashtable 的区别 HashSet 和 HashMap 区别 HashMap 和 ConcurrentHashMap 的区别 HashMap 的工做原理及代码实现 ConcurrentHashMap 的工做原理及代码实现算法

线程

建立线程的方式及实现 sleep() 、join()、yield()有什么区别 说说 CountDownLatch 原理 说说 CyclicBarrier 原理 说说 Semaphore 原理 说说 Exchanger 原理 说说 CountDownLatch 与 CyclicBarrier 区别 ThreadLocal 原理分析 讲讲线程池的实现原理 线程池的几种方式与使用场景 线程的生命周期sql

锁机制

说说线程安全问题 volatile 实现原理 synchronize 实现原理 synchronized 与 lock 的区别 CAS 乐观锁 ABA 问题 乐观锁的业务场景及实现方式数据库

核心篇

数据存储

MySQL 索引使用的注意事项 说说反模式设计 说说分库与分表设计 分库与分表带来的分布式困境与应对之策 说说 SQL 优化之道 MySQL 遇到的死锁问题 存储引擎的 InnoDB 与 MyISAM 数据库索引的原理 为何要用 B-tree 汇集索引与非汇集索引的区别 limit 20000 加载很慢怎么解决 选择合适的分布式主键方案 选择合适的数据存储方案 ObjectId 规则 聊聊 MongoDB 使用场景 倒排索引 聊聊 ElasticSearch 使用场景编程

缓存使用

Redis 有哪些类型 Redis 内部结构 Redis 内存淘汰机制 聊聊 Redis 使用场景 Redis 持久化机制 Redis 集群方案与实现 Redis 为何是单线程的 缓存崩溃 缓存降级 使用缓存的合理性问题后端

消息队列

消息队列的使用场景 消息的重发补偿解决思路 消息的幂等性解决思路(已解答,待补充) 消息的堆积解决思路 本身如何实现消息队列 如何保证消息的有序性设计模式

框架篇

Spring

BeanFactory 和 ApplicationContext 有什么区别 Spring Bean 的生命周期 Spring IOC 如何实现 说说 Spring AOP Spring AOP 实现原理 动态代理(cglib 与 JDK) Spring 事务实现方式 Spring 事务底层原理 如何自定义注解实现功能 Spring MVC 运行流程 Spring MVC 启动流程 Spring 的单例实现原理 Spring 框架中用到了哪些设计模式 Spring 其余产品(Srping Boot、Spring Cloud、Spring Secuirity、Spring Data、Spring AMQP 等)跨域

Netty

为何选择 Netty 说说业务中,Netty 的使用场景 原生的 NIO 在 JDK 1.7 版本存在 epoll bug 什么是TCP 粘包/拆包 TCP粘包/拆包的解决办法 Netty 线程模型 说说 Netty 的零拷贝 Netty 内部执行流程 Netty 重连实现缓存

微服务篇

微服务

先后端分离是如何作的 如何解决跨域 微服务哪些框架 你怎么理解 RPC 框架 说说 RPC 的实现原理 说说 Dubbo 的实现原理 你怎么理解 RESTful 说说如何设计一个良好的 API 如何理解 RESTful API 的幂等性 如何保证接口的幂等性 说说 CAP 定理、 BASE 理论 怎么考虑数据一致性问题 说说最终一致性的实现方案 你怎么看待微服务 微服务与 SOA 的区别 如何拆分服务 微服务如何进行数据库管理 如何应对微服务的链式调用异常 对于快速追踪与定位问题 微服务的安全

分布式

谈谈业务中使用分布式的场景 Session 分布式方案 分布式锁的场景 分布是锁的实现方案 分布式事务 集群与负载均衡的算法与实现 说说分库与分表设计 分库与分表带来的分布式困境与应对之策

安全问题

安全要素与 STRIDE 威胁 防范常见的 Web 攻击 服务端通讯安全攻防 HTTPS 原理剖析 HTTPS 降级攻击 受权与认证 基于角色的访问控制 基于数据的访问控制

性能优化

性能指标有哪些 如何发现性能瓶颈 性能调优的常见手段 说说你在项目中如何进行性能调优

大数据篇

离线计算

haddop的三大组件 hadoop shuffle原理 HDFS上传文件和读文件的流程 HDFS体系结构 mapreduce编程 yarn的原理和做用

hive

hive的原理 hive sql的优化 hive解决数据倾斜

hbase

hbase的架构 habase列族设计 hbase写入优化 hbase二级索引 hbase优化方法 rowkey设计

实时计算

kafka

kafka的架构和原理 kafka exactly-once语义 kafka分片 kafka数据同步 kafka位点

spark

spark的架构 spark streaming 的实现原理 spark rdd spark sql的优化 spark开发调优 spark 架构的角色

spark

Flink相关(请看这里:Flink

工程篇

需求分析

你如何对需求原型进行理解和拆分 说说你对功能性需求的理解 说说你对非功能性需求的理解 你针对产品提出哪些交互和改进意见 你如何理解用户痛点

设计能力

说说你在项目中使用过的 UML 图 你如何考虑组件化 你如何考虑服务化 你如何进行领域建模 你如何划分领域边界 说说你项目中的领域建模 说说概要设计

设计模式

你项目中有使用哪些设计模式 说说经常使用开源框架中设计模式使用分析 说说你对设计原则的理解 23种设计模式的设计理念 设计模式之间的异同,例如策略模式与状态模式的区别 设计模式之间的结合,例如策略模式+简单工厂模式的实践 设计模式的性能,例如单例模式哪一种性能更好。

业务工程

你系统中的先后端分离是如何作的 说说你的开发流程 你和团队是如何沟通的 你如何进行代码评审 说说你对技术与业务的理解 说说你在项目中常常遇到的 Exception 说说你在项目中遇到感受最难Bug,怎么解决的 说说你在项目中遇到印象最深困难,怎么解决的 你以为大家项目还有哪些不足的地方 你是否遇到过 CPU 100% ,如何排查与解决 你是否遇到过 内存 OOM ,如何排查与解决 说说你对敏捷开发的实践 说说你对开发运维的实践 介绍下工做中的一个对本身最有价值的项目,以及在这个过程当中的角色

软实力

说说你的亮点 说说你最近在看什么书 说说你以为最有意义的技术书籍 说说我的发展方向方面的思考 说说你认为的服务端开发工程师应该具有哪些能力 说说你认为的架构师是什么样的,架构师主要作什么 说说你所理解的技术专家

HR篇

你为何离开以前的公司 你为何要进咱们公司 说说职业规划 你如何看待加班问题 谈一谈你的一次失败经历 你以为你最大的优势是什么 你以为你最大的缺点是什么 你在工做之余作什么事情 你为何认为你适合这个职位 你以为本身那方面能力最急需提升 你来咱们公司最但愿获得什么 你但愿从这份工做中得到什么 你对如今应聘的职位有什么了解 您还有什么想问的 你怎么看待本身的职涯 谈谈你的家庭状况 你有什么业余爱好 你计划在公司工做多久

公众号推荐

  • 全网惟一一个从0开始帮助Java开发者转作大数据领域的公众号,BAT成员组团建设~
  • 海量【java和大数据的面试题+视频资料】整理在公众号,关注后能够下载~
  • 更多大数据技术欢迎和做者一块儿探讨~

相关文章
相关标签/搜索