众所周知,《剑指offer》是一本“好书”。java
为何这么说?git
由于在面试老鸟眼里,它里面罗列的算法题在面试中出现的频率是很是很是高的。github
有多高,以我目前很少的面试来看,在全部遇到的面试算法题中,出现原题的几率大概能有6成,若是把基于原题的变种题目算上,那么这个出现几率能到达9成,10题中9题见过。面试
若是你是个算法菜鸡(和我同样),那么最推荐的是先把剑指offer的题目搞明白。算法
至于为何给“好书”这两个字打引号,由于这本书成了面试官的必备,若是考生不会这本书上的题目,就极可能获得面试官负面的评价。这本书快要成为评判学生算法能力的惟一标准,这使得考前突击变成了一个惯例,反而让投机倒把成了必要,并不必定能真正的考察考生的算法能力。后端
对于剑指offer题解这个系列,个人写文章思路是,对于看了文章的读者,可以:数组
输入n个整数,找出其中最小的K个数。例如输入4,5,1,6,2,7,3,8这8个数字,则最小的4个数字是1,2,3,4,。安全
分类:优化时间和空间效率bash
直接对数组排序,排序后前k个数就是答案,排序通常较快的是O(nlogn),显然这并非时间复杂度最优解。微信
该方法须要改变原数组。
还记得上一题:数组中超过一半的数字么?这一题的思路和上题相似,仅仅是换成了
这种算法是受快速排序算法的启发。
在随机快速排序算法中,咱们先数组中随机选择一个数字,而后调整数组中数字的顺序,使得比选中的数字小的数字都排在它的左边,比选中的数字大的数字都排在它的右边。若是这个选中的数字的下标恰好是k,咱们就获得了k个小的数字,这些数字在k的左边,而且没有通过排序,可是都比k小。
若是它的下标大于k,咱们能够接着在它的左边部分的数组中查找。
若是它的下标小于k,那么中位数应该位于它的右边,咱们能够接着在它的右边部分的数组中查找。
这是一个典型的递归过程
详细细节见代码注释。
import java.util.ArrayList;
public class Solution {
public ArrayList<Integer> GetLeastNumbers_Solution(int [] input, int k) {
// 因为本题须要返回ArrayList<Integer>,因此新建之
ArrayList<Integer> list = new ArrayList<>();
// 若输入数组长度小于k。直接返回数空的ArrayList
if(input.length < k){
return list;
}
findKMin(input,0,input.length-1,k);
for(int i = 0; i < k; i++){
list.add(input[i]);
}
return list;
}
private void findKMin(int[] a, int start, int end, int k){
if(start < end){
int pos = partition(a, start, end);
if(pos == k-1){
return ;
}else if(pos < k-1){
findKMin(a,pos+1,end,k);
}else{
findKMin(a,start,pos-1,k);
}
}
}
// 快排中的每次排序实现(挖坑填数法),返回的是交换后start位置(快排一次后的中轴点,中轴点左边全是小于它的,右边都是大于它的)
public int partition(int[] a, int start, int end){
int pivot = a[start];
while(start < end){
while(start < end && a[end] >= pivot){end--;};
a[start] = a[end];
while(start < end && a[start] <= pivot){start++;};
a[end] = a[start];
}
a[start] = pivot;
return start;
}
}
复制代码
该方法不改变原数组,但时间复杂度比O(n)略微复杂了些。
构造一个最大堆,最大堆的性质就是堆顶是全部堆中数字的最大值,那么放入k个数字,随后将数字中k个数字以后的数字依次和堆中的最大数字比较(也就是和堆顶数字比较),若是小于他,就把堆顶数字弹出,放入小的数字,这样遍历一边数组后,获得一个k个数字的最大堆,这个最大堆里存的是最小的k个数。
最大堆的性质由Java中的优先队列,经过天然数的逆序顺序进行维护,也就是下面这句构造:
Queue<Integer> queue = new PriorityQueue<>(k, Collections.reverseOrder());
复制代码
有的小伙伴会问,为啥最大堆是最小的k个数?
答:说明你对堆还不够了解,恶补一下堆的性质吧~
import java.util.ArrayList;
public class Solution {
public ArrayList<Integer> GetLeastNumbers_Solution_2(int [] input, int k) {
// 因为本题须要返回ArrayList<Integer>,因此新建之
ArrayList<Integer> res = new ArrayList<>();
// 几种特殊状况
if (k > input.length|| k == 0) {
return res;
}
// 构造优先队列,排序方法是天然数顺序的逆序,因此是个最大堆,这样这个堆的堆顶就是全部数中的最大数
Queue<Integer> queue = new PriorityQueue<>(k, Collections.reverseOrder());
for (int i = 0; i < input.length; i++) {
// 最大堆内数字个数少于k,一直添加到k个
if (queue.size() < k) {
queue.add(input[i]);
}
else {
// 若堆内最大的数字大于数组中的数字,则将数字出堆,并放入这个小的数
if (input[i] < queue.peek()) {
queue.remove();
queue.add(input[i]);
}
}
}
// 结束上面循环后,堆内就是最小的k个数
while (!queue.isEmpty()) {
res.add(queue.remove());
}
return res;
}
public static void main(String[] args) {
int[] a = {4,5,1,6,2,7,3,8};
Solution_40 solution_40 = new Solution_40();
System.out.println(solution_40.GetLeastNumbers_Solution(a,4));
}
}
复制代码
书中提到,第二种堆的方法适合海量数据求k个最小。由于k个数的堆,空间是固定的,当数组超级大,那么全存入内存都变得不可行的时候,就须要从外存中慢慢读取数字,而后和这个堆进行比较。
而方法一就必须吧整个数组放入内存中,才能运行,因此不适合海量数据。
我目前是一名后端开发工程师。技术领域主要关注后端开发,数据爬虫,数据安全,5G,物联网等方向。
微信:yangzd1102
Github:@qqxx6661
我的博客:
若是文章对你有帮助,不妨收藏起来并转发给您的朋友们~