本文参考自《剑指offer》一书,代码采用Java语言。html
更多:《剑指Offer》Java实现合集 java
如何获得一个数据流中的中位数?若是从数据流中读出奇数个数值,那么中位数就是全部数值排序以后位于中间的数值。若是从数据流中读出偶数个数值,那么中位数就是全部数值排序以后中间两个数的平均值。ide
所谓数据流,就是不会一次性读入全部数据,只能一个一个读取,每一步都要求能计算中位数。函数
将读入的数据分为两部分,一部分数字小,另外一部分大。小的一部分采用大顶堆存放,大的一部分采用小顶堆存放。当总个数为偶数时,使两个堆的数目相同,则中位数=大顶堆的最大数字与小顶堆的最小数字的平均值;而总个数为奇数时,使小顶堆的个数比大顶堆多一,则中位数=小顶堆的最小数字。post
所以,插入的步骤以下:测试
1.若已读取的个数为偶数(包括0)时,两个堆的数目已经相同,将新读取的数插入到小顶堆中,从而实现小顶堆的个数多一。可是,若是新读取的数字比大顶堆中最大的数字还小,就不能直接插入到小顶堆中了 ,此时必须将新数字插入到大顶堆中,而将大顶堆中的最大数字插入到小顶堆中,从而实现小顶堆的个数多一。url
2若已读取的个数为奇数时,小顶堆的个数多一,因此要将新读取数字插入到大顶堆中,此时方法与上面相似。spa
测试算例 htm
1.功能测试(读入奇/偶数个数字)blog
2.边界值测试(读入0个、1个、2个数字)
//题目:如何获得一个数据流中的中位数?若是从数据流中读出奇数个数值,那么 //中位数就是全部数值排序以后位于中间的数值。若是从数据流中读出偶数个数值, //那么中位数就是全部数值排序以后中间两个数的平均值。 import java.util.PriorityQueue; import java.util.Comparator; public class StreamMedian { PriorityQueue<Integer> minHeap = new PriorityQueue<Integer>(); //小顶堆,默认容量为11 PriorityQueue<Integer> maxHeap = new PriorityQueue<Integer>(11,new Comparator<Integer>(){ //大顶堆,容量11 public int compare(Integer i1,Integer i2){ return i2-i1; } }); public void Insert(Integer num) { if(((minHeap.size()+maxHeap.size())&1)==0){//偶数时,下个数字加入小顶堆 if(!maxHeap.isEmpty() && maxHeap.peek()>num){ maxHeap.offer(num); num=maxHeap.poll(); } minHeap.offer(num); }else{//奇数时,下一个数字放入大顶堆 if(!minHeap.isEmpty() && minHeap.peek()<num){ minHeap.offer(num); num=minHeap.poll(); } maxHeap.offer(num); } } public Double GetMedian() { if((minHeap.size()+maxHeap.size())==0) throw new RuntimeException(); double median; if((minHeap.size()+maxHeap.size()&1)==0){ median=(maxHeap.peek()+minHeap.peek())/2.0; }else{ median=minHeap.peek(); } return median; } }
1.最大最小堆能够用PriorityQueue实现,PriorityQueue默认是一个小顶堆,经过传入自定义的Comparator函数能够实现大顶堆:
PriorityQueue<Integer> maxHeap = new PriorityQueue<Integer>(11,new Comparator<Integer>(){ //大顶堆,容量11 @Override public int compare(Integer i1,Integer i2){ return i2-i1; //降序排列 } });
PriorityQueue的经常使用方法有:poll(),offer(Object),size(),peek()等。
2.平均值应该定义为double,且(a+b)/2.0 。
3.往最大堆中插入数据时间复杂度是O(logn),获取最大数的时间复杂度是O(1)。
4.这道题关键在于分红两个平均分配的部分,奇偶时分别插入到最大最小堆中,利用最大最小堆性质的插入方法要掌握。