第一个问题,查找出1000万数据中最大的100万条。算法
对这个问题的第一反应就是利用排序算法,排序有不少种。其中以快排用的最多。只需屡次paration获得前100万便可。数组
还有一种思路就是创建一个100万大小的堆,而后再不断的对进来的数据进行堆调整。当查找出的数据越小的时候,优点会特别明显。好比100万变成100的时候,用堆将是最好选择。dom
第二个问题,对最大数为1000万的100万条数据进行排序,且数据无重复。ide
这个其实也能够用堆排序,快速排序进行处理。可是还能够用位图的方式进行处理。位图的时间复杂度是N,快于他们,只不过须要开辟100万/8个字节而已。spa
若是把题目改为,999999(100万-1)条数据中是由1-100万组成,且无重复,查找出那个缺失的数据。用位图的优点将会越加体现。比其余排序方法好不少。code
第三个问题,100万+1条数据中都是两两重复的,只有一条是单着的。blog
固然,咱们能够用排序。可是用这些数据所有与&,会快不少。因此位操做有时候很重要。排序
第四个问题,查找一本书中是否存在某个单词。字符串
这个问题,能够有不少种查找方式,好比说排序,经过基排序的方式,而后二分查找,这个很好,可是感受效率仍是不是很高。get
或者用hash对书中全部单词进行hash,再比较。
我认为最好的方式是创建字典树tire,这个很快很快。
第五个问题,随机产生1--N中M个数。
若是能够产生重复的数,那么很简单,直接rand(N) m次便可。可是若是不可重复呢?
1,利用随机的思想,开一个N大的数组,而后for i=1...M;每次产生一个随机数k,若是k>i,交换数组中的数,不然不交换,重复M次。
2,利用几率的思想,第一个数在M个数里面的几率是m/N,则随机产生一个数k,(1...N)若是k小于m,则添加到m里面,同时m=m-1,对第二个数2,进行处理,此时2添加到数组中的几率应该是(m)/N-1....后面同理
原本不想粘贴代码,仍是粘一下吧“
1 public static void getM(int n,int m){//等几率的取出其中m个数
2 for(int i=0;i<n;i++){ 3 Random random=new Random(); 4 int k=random.nextInt(10000); 5
6 if(m>0&&k%(n-i)<m){ 7 System.out.print(":"+i+" "); 8 m--; 9 if (m==0) { 10 break; 11 } 12 } 13 } 14 }
第六个问题,对于两个字符串,如何获得其中相同的子串呢?(不是子序列)子序列可不连续,可是子串必须连续。
第一反应用动态规划的思想求解。(暴力法时间复杂度过高)
第二,能够经过创建后缀数组的方式求解,后缀数组,排序。比较,获得答案。复杂度要比动态规划好。只不过是空间换时间罢了。代码就不贴了。
第七个问题,一堆单词集合M,一个字符串S。求出S能够在M中找到多少个单词。好比M={good,thank, you,are,do},S="goodoayouk".能到找到的单词是good,do,you.三个。
能够暴力法,硬匹配;
一种比较好的方法应该是利用AC自动机搜索。这个挺好,快!
第八个问题,求一个字符串中是否包含另一个子串。
BF暴力法能够解决,动态规划也能够解决。复杂度都是平方级的。
其实能够用KMP来解决,他的复杂度下降了,只不过要建一个next数组。用来保存主串的内在联系。到时候减小匹配次数。
贴个代码吧。没有check,可能有bug.
1 int KMP(char S[],char des[],int* next){ 2 int i=0,j=0; 3 while (i<strlen(S)&&j<strlen(des)) 4 { 5 if (j==-1||S[i]==des[j]) 6 { 7 i++;j++; 8 }else{ 9 j=next[j]; 10 } 11 } 12 if (j>=strlen(des)) 13 { 14 return i-strlen(des); 15 } 16 else return 0; 17 } 18 void getNext(char S[],int* next){ 19 int i=0,j=-1; 20 next[0]=-1; 21 while(i<strlen(S)){ 22 if (j==-1||S[i]==S[j]) 23 { 24 i++,j++; 25 next[i]=j; 26 }else{ 27 j=next[j]; 28 } 29 } 30 }
(本文只用做本身总结,故没有展开来讲,相关细节能够搜索其余文章,排版也不是个人长项,因此你们将就吧。)
未完待续。。。
版权全部,欢迎转载,可是转载请注明出处:潇一