IT又一蚂蚁金服面经

时间 2019-12-09

标签又一蚂蚁繁體版

原文原文链接

本文来自个人知识星球的球友投稿，他在最近的校招中拿到了蚂蚁金服的实习生Offer，总体思路和面试题目由做者——泽林提供，部分答案由Hollis整理自知识星球《Hollis和他的朋友们》中「直面Java」板块。java

因为做者面试过程当中高度紧张，本文中只列出了本身还记得的部分题目。linux

经历了漫长一个月的等待，终于在前几天经过面试官获悉已被蚂蚁金服录取，这期间的焦虑、痛苦自没必要说，知道被录取的那一刻，一全年的阴霾都一扫而空了。面试

笔者面的是阿里的Java研发工程师岗，面试流程是3轮技术面+1轮hr面。算法

1
数据库

意外的一面数组

一面的时候大概是3月12号，面完等了差很少半个月才忽然接到二面面试官的电话。一面多是简历面，因此问题比较简单。浏览器

ArrayList和LinkedList区别缓存

ArrayList 是一个可改变大小的数组。当更多的元素加入到ArrayList中时，其大小将会动态地增加。内部的元素能够直接经过get与set方法进行访问，由于ArrayList本质上就是一个数组，安全

LinkedList 是一个双链表，在添加和删除元素时具备比ArrayList更好的性能.但在get与set方面弱于ArrayList。bash

固然，这些对比都是指数据量很大或者操做很频繁的状况下的对比,若是数据和运算量很小，那么对比将失去意义。

什么状况会形成内存泄漏

在Java中，内存泄漏就是存在一些被分配的对象，这些对象有下面两个特色：

首先，这些对象是可达的，即在有向图中，存在通路能够与其相连；

其次，这些对象是无用的，即程序之后不会再使用这些对象。

若是对象知足这两个条件，这些对象就能够断定为Java中的内存泄漏，这些对象不会被GC所回收，然而它却占用内存。

什么是线程死锁，如何解决

产生死锁的条件有四个：

互斥条件：所谓互斥就是进程在某一时间内独占资源。
请求与保持条件：一个进程因请求资源而阻塞时，对已得到的资源保持不放。
不剥夺条件:进程已得到资源，在末使用完以前，不能强行剥夺。
循环等待条件:若干进程之间造成一种头尾相接的循环等待资源关系。

线程死锁是由于多线程访问共享资源，因为访问的顺序不当所形成的，一般是一个线程锁定了一个资源A，而又想去锁定资源B；在另外一个线程中，锁定了资源B，而又想去锁定资源A以完成自身的操做，两个线程都想获得对方的资源，而不肯释放本身的资源，形成两个线程都在等待，而没法执行的状况。

要解决死锁，能够从死锁的四个条件出发，只要破坏了一个必要条件，那么咱们的死锁就解决了。在java中使用多线程的时候必定要考虑是否有死锁的问题哦。

红黑树是什么？怎么实现？时间复杂度

红黑树(Red-Black Tree，简称R-B Tree)，它一种特殊的二叉查找树。红黑树是特殊的二叉查找树，意味着它知足二叉查找树的特征：任意一个节点所包含的键值，大于等于左孩子的键值，小于等于右孩子的键值。除了具有该特性以外，红黑树还包括许多额外的信息。

红黑树的每一个节点上都有存储位表示节点的颜色，颜色是红(Red)或黑(Black)。红黑树的特性:

每一个节点或者是黑色，或者是红色。
根节点是黑色。
每一个叶子节点是黑色。
若是一个节点是红色的，则它的子节点必须是黑色的。
从一个节点到该节点的子孙节点的全部路径上包含相同数目的黑节点。

关于它的特性，须要注意的是：

第一，特性(3)中的叶子节点，是只为空(NIL或null)的节点。

第二，特性(5)，确保没有一条路径会比其余路径长出俩倍。于是，红黑树是相对是接近平衡的二叉树。

具体实现代码这里不贴了，要实现起来，须要包含的基本操做是添加、删除和旋转。在对红黑树进行添加或删除后，会用到旋转方法。旋转的目的是让树保持红黑树的特性。旋转包括两种：左旋和右旋。

红黑树的应用比较普遍，主要是用它来存储有序的数据，它的查找、插入和删除操做的时间复杂度是O(lgn)。

TCP三次握手

三次握手（three times handshake；three-way handshake）所谓的“三次握手”即对每次发送的数据量是怎样跟踪进行协商使数据段的发送和接收同步，根据所接收到的数据量而肯定的数据确认数及数据发送、接收完毕后什么时候撤消联系，并创建虚链接。

为了提供可靠的传送，TCP在发送新的数据以前，以特定的顺序将数据包的序号，并须要这些包传送给目标机以后的确认消息。TCP老是用来发送大批量的数据。当应用程序在收到数据后要作出确认时也要用到TCP。

第一次握手：创建链接时，客户端发送syn包（syn=j）到服务器，并进入SYN_SENT状态，等待服务器确认；SYN：同步序列编号（Synchronize Sequence Numbers）。

第二次握手：服务器收到syn包，必须确认客户的SYN（ack=j+1），同时本身也发送一个SYN包（syn=k），即SYN+ACK包，此时服务器进入SYN_RECV状态；

第三次握手：客户端收到服务器的SYN+ACK包，向服务器发送确认包ACK(ack=k+1），此包发送完毕，客户端和服务器进入ESTABLISHED（TCP链接成功）状态，完成三次握手。

忽然的二面

一面的时候大概是3月12号，面完等了差很少半个月才忽然接到二面面试官的电话。

介绍项目

Storm怎么保证一致性

Storm是一个分布式的流处理系统，利用anchor和ack机制保证全部tuple都被成功处理。若是tuple出错，则能够被重传，可是如何保证出错的tuple只被处理一次呢？Storm提供了一套事务性组件Transaction Topology，用来解决这个问题。

Transactional Topology目前已经再也不维护，由Trident来实现事务性topology，可是原理相同。

参考：https://dwz.cn/8bXRPexB

说一下hashmap以及它是否线程安全

HashMap基于哈希表的 Map 接口的实现。HashMap中，null能够做为键，这样的键只有一个；能够有一个或多个键所对应的值为null。HashMap中hash数组的默认大小是16，并且必定是2的指数。Hashtable、HashMap都使用了 Iterator。而因为历史缘由，Hashtable还使用了Enumeration的方式。HashMap 实现 Iterator，支持fast-fail。

哈希表是由数组+链表组成的，它是经过把key值进行hash来定位对象的，这样能够提供比线性存储更好的性能。

HashMap不是线程安全的。

十亿条淘宝购买记录，怎么获取出现最多的前十个

这是一道典型的有限内存的海量数据处理的题目。通常这类题目的解答无非是如下几种：

分治，hash映射，堆排序，双层桶划分，Bloom Filter，bitmap，数据库索引，mapreduce等。

具体情形都有不少不一样的方案。这类题目能够到网上搜索一下，了解下套路，后面就基本都会了。

平时有没有用linux系统，怎么查看某个进程

复制代码

说一下Innodb和MySIAM的区别

MyISAM类型不支持事务处理等高级处理，而InnoDB类型支持。MyISAM类型的表强调的是性能，其执行数度比InnoDB类型更快，可是不提供事务支持，而InnoDB提供事务支持以及外部键等高级数据库功能。

InnoDB不支持FULLTEXT类型的索引。

InnoDB 中不保存表的具体行数，也就是说，执行select count(*) from table时，InnoDB要扫描一遍整个表来计算有多少行，可是MyISAM只要简单的读出保存好的行数便可。注意的是，当count(*)语句包含 where条件时，两种表的操做是同样的。

对于AUTO_INCREMENT类型的字段，InnoDB中必须包含只有该字段的索引，可是在MyISAM表中，能够和其余字段一块儿创建联合索引。

DELETE FROM table时，InnoDB不会从新创建表，而是一行一行的删除。

LOAD TABLE FROM MASTER操做对InnoDB是不起做用的，解决方法是首先把InnoDB表改为MyISAM表，导入数据后再改为InnoDB表，可是对于使用的额外的InnoDB特性(例如外键)的表不适用。

说一下jvm内存模型，介绍一下你了解的垃圾收集器

其实并无jvm内存模型的概念。应该是Java内存模型或者jvm内存结构，这里面试者必定要听清楚问的是哪一个，再回答。

能够参考：JVM内存结构 VS Java内存模型 VS Java对象模型

你说你是大数据方向的，了解哪些大数据框架

做者回答了一些zookeeper、storm、HDFS、Hbase等

其余问题

100个有序的整型，如何打乱顺序？

如何设计一个可靠的UDP协议？

二面大概就是这些，其中storm一致性这个问题被面试官怀疑了一下，就有点紧张，其实没答错，因此仍是要对知识掌握得更明确才行。

准备充足的三面

清明节的时候例外地没有回家扫墓，由于知道本身的弱项是操做系统和海量数据题这块，因此想着恶补这方面的知识，不过以后的面试意外的并无问到这方面的内容。

介绍项目

项目介绍完以后没问太多

介绍一下hashmap

HashMap真的是面试高频题，屡次面试都问到了，必定要掌握。

介绍一下并发

这里能够把整个并发的体系都说下，包括volatile、synchronized、lock、乐观悲观锁、锁膨胀、锁降级、线程池等

银行帐户读写怎么作

我说了读写锁以及可能出现死锁问题

说一下关系型数据库和非关系型数据库的区别

非关系型数据库的优点：

性能：NOSQL是基于键值对的，能够想象成表中的主键和值的对应关系，并且不须要通过SQL层的解析，因此性能很是高
可扩展性：一样也是由于基于键值对，数据之间没有耦合性，因此很是容易水平扩展。

使用场景：日志、埋点、论坛、博客等

关系型数据库的优点：

复杂查询：能够用SQL语句方便的在一个表以及多个表之间作很是复杂的数据查询
事务支持:使得对于安全性能很高的数据访问要求得以实现。

使用场景：全部有逻辑关系的数据存储

如何访问链表中间节点

对于这个问题，咱们首先可以想到的就是先遍历一遍整个的链表，而后计算出链表的长度，进而遍历第二遍找出中间位置的数据。这种方式很是简单。

若题目要求只能遍历一次链表，那又当如何解决问题？

能够采起创建两个指针，一个指针一次遍历两个节点，另外一个节点一次遍历一个节点，当快指针遍历到空节点时，慢指针指向的位置为链表的中间位置，这种解决问题的方法称为快慢指针方法。

说下进程间通讯，以及各自的区别

进程间通讯是指在不一样进程之间传播或交换信息。方式一般有管道（包括无名管道和命名管道）、消息队列、信号量、共享存储、Socket、Streams等。

访问淘宝网页的一个具体流程，从获取ip地址，到怎么返回相关内容

先经过DNS解析到服务器地址，而后反向代理、负载均衡服务器等，寻找集群中的一台机器来真正执行你的请求。还能够介绍CDN、页面缓存、Cookie以及session等。

这个过程还包括三次握手、HTTP request中包含哪些内容，状态码等，还有OSI七层分层能够介绍。

服务器接到请求后，会执行业务逻辑，执行过程当中能够按照MVC来分别介绍。

服务处理过程当中是否调用其余RPC服务或者异步消息，这个过程包含服务发现与注册，消息路由。

最后查询数据库，会不会通过缓存？是否是关系型数据库？是会分库分表仍是作哪些操做？

对于数据库，分库分表若是数据量大的话是有必要的，通常业务根据一个分表字段进行取模进行分表，而在作数据库操做的时候，也根据一样的规则，决定数据的读写操做对应哪张表。这种也有开源的实现的，如阿里的TDDL就有这种功能。分库分表还涉及到不少技术，好比sequence如何设置，如何解决热点问题等。

最后再把处理结果封装成response，返回给客户端。浏览器再进行页面渲染。

焦虑的hr面

之因此说hr面焦虑，是由于面试前我还在看IG的半决赛（实在复习不下），接到电话的时候分外紧张，在一些点上答得不好。

遇到什么挫折

这种问题主要考察面试者碰见困难是否能坚持下去，而且能够看出他的解决问题的能力。

能够简单描述挫折，并说明本身如何克服，最终有哪些收获。

职业规划

代表本身决心，首先本身不许备继续求学了，必须招工做了。而后说下本身不会短时间内换行业，或者换工做，本身比较喜欢，但愿能够坚持几年看本身的兴趣再规划之类的。

对阿里的认识

这个比较简答，夸就好了。

有什么崇拜的人吗

我说了詹姆斯哈登，hr小姐姐竟然笑了。

这个能够说一些IT大牛。

但愿去哪里就业

这个问题果断回答该公司所在的城市啊。

其余问题

有什么兴趣爱好，能拿得上台表演的有吗

记忆深入的事情

总结

提早批更多的是考察基础知识，大公司都有本身在用的框架，你进去后基本上得从新学这些框架，因此对他们来讲，基础是否扎实才是考察的关键。

基础包括：操做系统、linxu、数据库、数据结构、算法、java（基础、容器、高并发、jvm）、计算机网络等

建议要投资知识，从寒假到如今，前后买了9个极客时间的课程、订阅了H神的知识星球、当当买了四五本相关技术书籍…

虽然购买的课不少还来不及读（惭愧）

当时我问一个java群的师兄，学不下了怎么办，他说，换种姿式继续学，还别说，有时候失眠的时候，我都在看极客时间或知识星球催眠本身…

要对知识作好总结，虽然之前也有记录简书的习惯，可是大多数时候都是写了不发表，本身作一个记忆的做用，3月份我给本身的要求就是，对每一个知识点要作到可以有本身的理解，而后写一篇质量较好的博客总结。

面试建议是，必定要自信，勇于表达，面试的时候咱们对知识的掌握有时候很难面面俱到，把本身的思路说出来，而不是直接告诉面试官本身不懂，这也是能够加分的。