剑指Offer(java版):第一个只出现一次的字符

题目:在字符串中找出第一个只出现一次的字符。如输入"abaccdeff",则输出'b'.java

看到这样的题目,咱们最直观的想法就是从头开始扫描这个字符串中的字 符。当访问某个字符时拿这个字符和后面的每一个字符相比较,若是在后面没有发现重复的字符,则该字符就是只出现一次的字符。若是字符串有n个字符,每一个字符 可能与后面的O(n)个字符想比较,所以这种思路的时间复杂度为O(n2),面试官不会满意这种思路,它会提示咱们继续想更快的思路。面试

因为题目与字符出现的次数有关,咱们是否是可疑统计每一个字符在该字符 串中出现的次数,要达到这个目的,咱们须要一个数据容器来存放每一个字符出现的次数。在这个容器中能够根据字符来查找它出现的次数,也就是说这个容器的做用 就是把一个字符映射称一个数字。在经常使用的数据容器中,哈希表正是这个用途。算法

为了解决这个问题,咱们能够定义哈希表的键值(key)是字符,而值 (Value)是该字符出现的次数。同时咱们还须要从头开始扫描字符串两次。第一次扫描字符串时,每扫描到一个字符就在哈希表中的对应项中把次数加1.接 下来第二次扫描时,每扫描到一个字符就能从哈希表中获得该字符出现的次数。这样第一个只出现一次的字符就是符合要求的输出。数组

用Java代码实现咱们的思路:app

package cglib;函数

import java.util.LinkedHashMap;性能

public class jiekou {ui

    public Character firstNotRepeating(String str){  
        if(str == null)  
            return null;  
        char[] strChar = str.toCharArray();  //将字符串转换成数组
        LinkedHashMap<Character,Integer> hash = new LinkedHashMap<Character,Integer>();  
        for(char item:strChar){  
            if(hash.containsKey(item))  
                hash.put(item, hash.get(item)+1);  
            else  
                hash.put(item, 1);  
        }  
        for(char key:hash.keySet())  
        {  
            if(hash.get(key)== 1)  
                return key;  
        }  
        return null;  
    }  
    public static void main(String[] args){  
        String str = "abaccdebff";  
        jiekou test = new jiekou();  
        System.out.println(test.firstNotRepeating(str));  
    }  
     }this

 

输出dgoogle

 

拓展1:

在前面的例子中,咱们之因此能够把哈希表的大小设为256,是由于字符(char)是8个bit的类型,总共只有256个字符。但实际上字符不仅是256个,好比中文就有几千个汉字。若是题目要求考虑汉字,前面的算法是否是有问题?若是有,能够怎么解决。

 

public class jiekou {

     /**
     * @param args
     */  
    public static void main(String[] args) {  
        // TODO 自动生成的方法存根  
        String testString="ccaaddddb北京bb11大学??//";  
        getFirstMaxOccurrenceChar(testString);  
      
 
 
    }  
    /*查找第一次出现单独字符的主函数*/  
    private static void getFirstMaxOccurrenceChar(String temString) {  
        char[] temp=temString.toCharArray();  
        MyHashTable myHashTable=new MyHashTable();  
        for (char c : temp) {  
            MyData myData=new MyData();  
            myData.setCharData(c);  
            myHashTable.insert(myData);  
        }  
        MyData[] result=MyHashTable.getHashMap();  
        boolean flag=false;  
        for (int i = 0; i < result.length; i++) {  
            MyData myData = result[i];  
            /*只要hash表中该数据不为null且计数为1则输出并跳出循环*/  
            if (myData!=null&&myData.getCount()==1) {  
                System.out.println("第一次出现单字符为:"+myData.getCharData());  
                flag=true;  
                break;  
            }  
        }  
        if (flag==false) {  
            System.out.println("不存在单字符!");  
        }  
    }  
 
}  
/*设计hash表,包含一个长度为Oxffff的数组和insert函数*/  
class MyHashTable{  
    private static MyData[] hashMap=new MyData[0xffff];  
    /*若是第一次插入,则将计数设置为1,不然计数+1*/  
    public void insert(MyData myData){  
        if (hashMap[myData.getCharData()]==null) {  
            myData.setCount(1);  
        }else {  
            myData.setCount(hashMap[myData.getCharData()].getCount()+1);  
        }  
        hashMap[myData.getCharData()]=myData;  
          
    }  
    public static MyData[] getHashMap() {  
        return hashMap;  
    }  
      
}  
/*设计hash表中的类型,即一个字符和它的计数*/  
class MyData{  
    private char charData;  
    private int count;  
    public char getCharData() {  
        return charData;  
    }  
    public void setCharData(char charData) {  
        this.charData = charData;  
    }  
    public int getCount() {  
        return count;  
    }  
    public void setCount(int count) {  
        this.count = count;  
    }  
     }   


输出

第一次出现单字符为:京

 

拓展2:

定义一个函数,输入两个字符串,从第一个字符串中删除在第二个字符串中出现过的全部字符。例如第一个字符串"we are students",第二个字符串是"aeiou",结果应该是"w r stdnts"。

package cglib;


public class jiekou {

    
         public static String fun1 ( String s, String b )
            {
                if (s.isEmpty ())
                {
                    return "";
                }
                char first = s.charAt (0);
                if (b.indexOf (first) != -1)//返回 String 对象b内第一次出现子字符串的字符位置
                {
                    return fun1 (s.substring (1), b);//截取s的下标为1的字符串,跟b继续比较
                }
                return first + fun1 (s.substring (1), b);//b中没有这个,则没有的这个字符返回
            }
        
            public static void print ( String s )
            {
                for ( int i = 0; i < s.length (); i++ )
                {
                    System.out.print (s.charAt (i));
                }
            }
        
            public static void main ( String args[] )
            {
                String str = "we are students";  
                String str1 = "aeiou";
                String str2 = fun1 (str, str1);
                print (str2);
            }
     }   


输出:

w r stdnts

 

拓展3: 定义一个函数,删除字符串中全部重复出现的字符。例如输入"google",则输出结果应该是"gole"。

package cglib;

import java.util.ArrayList;
import java.util.LinkedHashSet;
import java.util.List;
import java.util.Set;

public class jiekou {

    static StringBuffer sb = new StringBuffer();

    // 普通的方法,不使用集合
    static void removeDuplicateByOriginalMethod(String str) {

        System.out.println("方法一:普通方法");
        char[] cy = str.toCharArray();
        String temp = "";
        for (int i = 0; i < cy.length; i++) {
            if (temp.indexOf(cy[i]) == -1) {
                temp += cy[i];
            }
        }
        System.out.println("去除重复字符后:" + temp);
        sb.setLength(0);
    }

    // 方法二,使用LinkedHashSet能够在去掉重复字符后按照原字符顺序排列字符
    static void removeDuplicateByLinkedHashSet(String str, String[] ss, int len) {
        System.out.println("方法二:LinkedHashSet");
        Set<String> set = new LinkedHashSet<String>();
        iterate(set, ss, len);
        System.out.println("去除重复字符后:" + sb.toString());
        // 清空StringBuffer对象sb
        sb.setLength(0);
    }

    // 方法三,使用ArrayList能够在去掉重复字符后按照原字符顺序排列字符
    static void removeDuplicateByArrayList(String str, String[] ss, int len) {
        System.out.println("方法三:ArrayList");
        List<String> list = new ArrayList<>();
        iterate(list, ss, len);
        System.out.println("去除重复字符后:" + sb.toString());
        // 记住要输出后才清空sb
        sb.setLength(0);
    }

    // 集合迭代器,用于去除重复字符并从新拼接字符
    static void iterate(Object obj, String[] ss, int len) {
        if (obj instanceof Set) {
            System.out.println("迭代器正在迭代Set");
            @SuppressWarnings("unchecked")
            Set<String> set = (Set<String>) obj;
            for (int i = 0; i < len; i++) {
                if (!set.contains(ss[i])) {
                    set.add(ss[i]);
                }
            }
            for (String s : set) {
                sb.append(s);
            }
        }
        if (obj instanceof List) {
            System.out.println("迭代器正在迭代List");
        
            @SuppressWarnings("unchecked")
            List<String> list = (List<String>) obj;
            for (int i = 0; i < len; i++) {
                if (!list.contains(ss[i])) {
                    list.add(ss[i]);
                }
            }
            for (String s : list) {
                sb.append(s);
            }
        }
    }

    public static void main(String[] args) {
        String str = "google";
        String[] ss = str.split(""); // 在此处先拆分字符串,处理后再传给各个须要用到的方法,提升程序性能。
        int len = ss.length;
        System.out.println("等待去除重复字符的字符串:" + str);
        //方法一
        removeDuplicateByOriginalMethod(str);
        // 方法二
        removeDuplicateByLinkedHashSet(str, ss, len);
        // 方法三
        removeDuplicateByArrayList(str, ss, len);
    }

    
     }   

输出:

方法一:普通方法
去除重复字符后:gole
方法二:LinkedHashSet
迭代器正在迭代Set
去除重复字符后:gole
方法三:ArrayList
迭代器正在迭代List
去除重复字符后:gole

 

拓展4:

请完成一个函数,判断输入的两个字符串是不是Anagram,即互为变位词

变位词(anagrams)指的是组成两个单词的字符相同,但位置不一样的单词。好比说, abbcd和abcdb就是一对变位词。该题目有两种作法:

O(nlogn)的解法

因为组成变位词的字符是如出一辙的,因此按照字典序排序后,两个字符串也就相等了。 所以咱们能够用O(nlogn)的时间去排序,而后用O(n)的时间比较它们是否相等便可。

package cglib;

import java.util.Arrays;

public class jiekou {

    public static void main(String[] args) {
        // TODO Auto-generated method stub
        System.out.println(func("silent", "listen"));
        System.out.println(func("", ""));
        System.out.println(func("silent", "liste"));
        
    }

    public static boolean func(String str1, String str2) {
        
        if(str1.length() != str2.length()){  
            return false;  
        }
        char[] arr1 = str1.toCharArray();
        char[] arr2 = str2.toCharArray();
        Arrays.sort(arr1);
        Arrays.sort(arr2);
        for(int i = 0; i < arr1.length; i++) {
            if(arr1[i] != arr2[i]) {
                return false;
            }
        }
        return true;
    }
    
     }  

输出
true
true
false

 

O(n)的解法

因为组成变位词的字符是如出一辙的, 所以咱们能够先统计每一个字符串中各个字符出现的次数, 而后看这两个字符串中各字符出现次数是否同样。若是是,则它们是一对变位词。 这须要开一个辅助数组来保存各字符的出现次数。咱们能够开一个大小是256的整数数组, 遍历第一个字符串时,将相应字符出现的次数加1;遍历第二个字符串时, 将相应字符出现的次数减1。最后若是数组中256个数都为0,说明两个字符串是一对变位词。 (第1个字符串中出现的字符都被第2个字符串出现的字符抵消了), 若是数组中有一个不为0,说明它们不是一对变位词。

package cglib;

public class jiekou {

    public static void main(String[] args) {
        // TODO Auto-generated method stub
        System.out.println(anagram("silent", "listen"));
        //System.out.println(anagram("", ""));
        //System.out.println(anagram("silent", "liste"));
        
    }

    private static boolean anagram(String s1,String s2){  
        
        int[] nums = new int[26];  
          
        char[] s1_char = s1.toCharArray();  
        char[] s2_char = s2.toCharArray();  
          
        int s1_length = s1_char.length;  
        int s2_length = s2_char.length;  
          
        if(s1_length != s2_length){  
            return false;  
        }  
          
        for(int i=0; i<s1_length; i++){
            System.out.println("s1的s1_char[i]="+s1_char[i]);
            int index = s1_char[i] - 'a';
            System.out.println("s1的index="+index);
            nums[index]++;
            System.out.println("s1的nums[index]="+nums[index]);
        }  
 
        for(int i=0; i<s1_length; i++){
            System.out.println("s2的s2_char[i]="+s2_char[i]);
            int index = s2_char[i] - 'a';
            System.out.println("s2的index="+index);
            nums[index]--;
            System.out.println("s2的nums[index]="+nums[index]);
        }  
          
        for(int i=0; i<nums.length; i++){
            System.out.println("nums的i="+i);
            System.out.println("nums[i]="+nums[i]);
            if(nums[i]>0) return false;  
        }  
          
        return true;  
          
    }   


    
     }   


输出:

s1的s1_char[i]=s s1的index=18 s1的nums[index]=1 s1的s1_char[i]=i s1的index=8 s1的nums[index]=1 s1的s1_char[i]=l s1的index=11 s1的nums[index]=1 s1的s1_char[i]=e s1的index=4 s1的nums[index]=1 s1的s1_char[i]=n s1的index=13 s1的nums[index]=1 s1的s1_char[i]=t s1的index=19 s1的nums[index]=1 s2的s2_char[i]=l s2的index=11 s2的nums[index]=0 s2的s2_char[i]=i s2的index=8 s2的nums[index]=0 s2的s2_char[i]=s s2的index=18 s2的nums[index]=0 s2的s2_char[i]=t s2的index=19 s2的nums[index]=0 s2的s2_char[i]=e s2的index=4 s2的nums[index]=0 s2的s2_char[i]=n s2的index=13 s2的nums[index]=0 nums的i=0 nums[i]=0 nums的i=1 nums[i]=0 nums的i=2 nums[i]=0 nums的i=3 nums[i]=0 nums的i=4 nums[i]=0 nums的i=5 nums[i]=0 nums的i=6 nums[i]=0 nums的i=7 nums[i]=0 nums的i=8 nums[i]=0 nums的i=9 nums[i]=0 nums的i=10 nums[i]=0 nums的i=11 nums[i]=0 nums的i=12 nums[i]=0 nums的i=13 nums[i]=0 nums的i=14 nums[i]=0 nums的i=15 nums[i]=0 nums的i=16 nums[i]=0 nums的i=17 nums[i]=0 nums的i=18 nums[i]=0 nums的i=19 nums[i]=0 nums的i=20 nums[i]=0 nums的i=21 nums[i]=0 nums的i=22 nums[i]=0 nums的i=23 nums[i]=0 nums的i=24 nums[i]=0 nums的i=25 nums[i]=0 true

相关文章
相关标签/搜索