题目:在字符串中找出第一个只出现一次的字符。如输入"abaccdeff",则输出'b'.java
看到这样的题目,咱们最直观的想法就是从头开始扫描这个字符串中的字 符。当访问某个字符时拿这个字符和后面的每一个字符相比较,若是在后面没有发现重复的字符,则该字符就是只出现一次的字符。若是字符串有n个字符,每一个字符 可能与后面的O(n)个字符想比较,所以这种思路的时间复杂度为O(n2),面试官不会满意这种思路,它会提示咱们继续想更快的思路。面试
因为题目与字符出现的次数有关,咱们是否是可疑统计每一个字符在该字符 串中出现的次数,要达到这个目的,咱们须要一个数据容器来存放每一个字符出现的次数。在这个容器中能够根据字符来查找它出现的次数,也就是说这个容器的做用 就是把一个字符映射称一个数字。在经常使用的数据容器中,哈希表正是这个用途。算法
为了解决这个问题,咱们能够定义哈希表的键值(key)是字符,而值 (Value)是该字符出现的次数。同时咱们还须要从头开始扫描字符串两次。第一次扫描字符串时,每扫描到一个字符就在哈希表中的对应项中把次数加1.接 下来第二次扫描时,每扫描到一个字符就能从哈希表中获得该字符出现的次数。这样第一个只出现一次的字符就是符合要求的输出。数组
用Java代码实现咱们的思路:app
package cglib;函数
import java.util.LinkedHashMap;性能
public class jiekou {ui
public Character firstNotRepeating(String str){
if(str == null)
return null;
char[] strChar = str.toCharArray(); //将字符串转换成数组
LinkedHashMap<Character,Integer> hash = new LinkedHashMap<Character,Integer>();
for(char item:strChar){
if(hash.containsKey(item))
hash.put(item, hash.get(item)+1);
else
hash.put(item, 1);
}
for(char key:hash.keySet())
{
if(hash.get(key)== 1)
return key;
}
return null;
}
public static void main(String[] args){
String str = "abaccdebff";
jiekou test = new jiekou();
System.out.println(test.firstNotRepeating(str));
}
}this
输出dgoogle
拓展1:
在前面的例子中,咱们之因此能够把哈希表的大小设为256,是由于字符(char)是8个bit的类型,总共只有256个字符。但实际上字符不仅是256个,好比中文就有几千个汉字。若是题目要求考虑汉字,前面的算法是否是有问题?若是有,能够怎么解决。
public class jiekou {
/**
* @param args
*/
public static void main(String[] args) {
// TODO 自动生成的方法存根
String testString="ccaaddddb北京bb11大学??//";
getFirstMaxOccurrenceChar(testString);
}
/*查找第一次出现单独字符的主函数*/
private static void getFirstMaxOccurrenceChar(String temString) {
char[] temp=temString.toCharArray();
MyHashTable myHashTable=new MyHashTable();
for (char c : temp) {
MyData myData=new MyData();
myData.setCharData(c);
myHashTable.insert(myData);
}
MyData[] result=MyHashTable.getHashMap();
boolean flag=false;
for (int i = 0; i < result.length; i++) {
MyData myData = result[i];
/*只要hash表中该数据不为null且计数为1则输出并跳出循环*/
if (myData!=null&&myData.getCount()==1) {
System.out.println("第一次出现单字符为:"+myData.getCharData());
flag=true;
break;
}
}
if (flag==false) {
System.out.println("不存在单字符!");
}
}
}
/*设计hash表,包含一个长度为Oxffff的数组和insert函数*/
class MyHashTable{
private static MyData[] hashMap=new MyData[0xffff];
/*若是第一次插入,则将计数设置为1,不然计数+1*/
public void insert(MyData myData){
if (hashMap[myData.getCharData()]==null) {
myData.setCount(1);
}else {
myData.setCount(hashMap[myData.getCharData()].getCount()+1);
}
hashMap[myData.getCharData()]=myData;
}
public static MyData[] getHashMap() {
return hashMap;
}
}
/*设计hash表中的类型,即一个字符和它的计数*/
class MyData{
private char charData;
private int count;
public char getCharData() {
return charData;
}
public void setCharData(char charData) {
this.charData = charData;
}
public int getCount() {
return count;
}
public void setCount(int count) {
this.count = count;
}
}
输出
第一次出现单字符为:京
拓展2:
定义一个函数,输入两个字符串,从第一个字符串中删除在第二个字符串中出现过的全部字符。例如第一个字符串"we are students",第二个字符串是"aeiou",结果应该是"w r stdnts"。
package cglib;
public class jiekou {
public static String fun1 ( String s, String b )
{
if (s.isEmpty ())
{
return "";
}
char first = s.charAt (0);
if (b.indexOf (first) != -1)//返回 String 对象b内第一次出现子字符串的字符位置
{
return fun1 (s.substring (1), b);//截取s的下标为1的字符串,跟b继续比较
}
return first + fun1 (s.substring (1), b);//b中没有这个,则没有的这个字符返回
}
public static void print ( String s )
{
for ( int i = 0; i < s.length (); i++ )
{
System.out.print (s.charAt (i));
}
}
public static void main ( String args[] )
{
String str = "we are students";
String str1 = "aeiou";
String str2 = fun1 (str, str1);
print (str2);
}
}
输出:
w r stdnts
拓展3: 定义一个函数,删除字符串中全部重复出现的字符。例如输入"google",则输出结果应该是"gole"。
package cglib;
import java.util.ArrayList;
import java.util.LinkedHashSet;
import java.util.List;
import java.util.Set;
public class jiekou {
static StringBuffer sb = new StringBuffer();
// 普通的方法,不使用集合
static void removeDuplicateByOriginalMethod(String str) {
System.out.println("方法一:普通方法");
char[] cy = str.toCharArray();
String temp = "";
for (int i = 0; i < cy.length; i++) {
if (temp.indexOf(cy[i]) == -1) {
temp += cy[i];
}
}
System.out.println("去除重复字符后:" + temp);
sb.setLength(0);
}
// 方法二,使用LinkedHashSet能够在去掉重复字符后按照原字符顺序排列字符
static void removeDuplicateByLinkedHashSet(String str, String[] ss, int len) {
System.out.println("方法二:LinkedHashSet");
Set<String> set = new LinkedHashSet<String>();
iterate(set, ss, len);
System.out.println("去除重复字符后:" + sb.toString());
// 清空StringBuffer对象sb
sb.setLength(0);
}
// 方法三,使用ArrayList能够在去掉重复字符后按照原字符顺序排列字符
static void removeDuplicateByArrayList(String str, String[] ss, int len) {
System.out.println("方法三:ArrayList");
List<String> list = new ArrayList<>();
iterate(list, ss, len);
System.out.println("去除重复字符后:" + sb.toString());
// 记住要输出后才清空sb
sb.setLength(0);
}
// 集合迭代器,用于去除重复字符并从新拼接字符
static void iterate(Object obj, String[] ss, int len) {
if (obj instanceof Set) {
System.out.println("迭代器正在迭代Set");
@SuppressWarnings("unchecked")
Set<String> set = (Set<String>) obj;
for (int i = 0; i < len; i++) {
if (!set.contains(ss[i])) {
set.add(ss[i]);
}
}
for (String s : set) {
sb.append(s);
}
}
if (obj instanceof List) {
System.out.println("迭代器正在迭代List");
@SuppressWarnings("unchecked")
List<String> list = (List<String>) obj;
for (int i = 0; i < len; i++) {
if (!list.contains(ss[i])) {
list.add(ss[i]);
}
}
for (String s : list) {
sb.append(s);
}
}
}
public static void main(String[] args) {
String str = "google";
String[] ss = str.split(""); // 在此处先拆分字符串,处理后再传给各个须要用到的方法,提升程序性能。
int len = ss.length;
System.out.println("等待去除重复字符的字符串:" + str);
//方法一
removeDuplicateByOriginalMethod(str);
// 方法二
removeDuplicateByLinkedHashSet(str, ss, len);
// 方法三
removeDuplicateByArrayList(str, ss, len);
}
}
输出:
方法一:普通方法
去除重复字符后:gole
方法二:LinkedHashSet
迭代器正在迭代Set
去除重复字符后:gole
方法三:ArrayList
迭代器正在迭代List
去除重复字符后:gole
拓展4:
请完成一个函数,判断输入的两个字符串是不是Anagram,即互为变位词
变位词(anagrams)指的是组成两个单词的字符相同,但位置不一样的单词。好比说, abbcd和abcdb就是一对变位词。该题目有两种作法:
O(nlogn)的解法
因为组成变位词的字符是如出一辙的,因此按照字典序排序后,两个字符串也就相等了。 所以咱们能够用O(nlogn)的时间去排序,而后用O(n)的时间比较它们是否相等便可。
package cglib;
import java.util.Arrays;
public class jiekou {
public static void main(String[] args) {
// TODO Auto-generated method stub
System.out.println(func("silent", "listen"));
System.out.println(func("", ""));
System.out.println(func("silent", "liste"));
}
public static boolean func(String str1, String str2) {
if(str1.length() != str2.length()){
return false;
}
char[] arr1 = str1.toCharArray();
char[] arr2 = str2.toCharArray();
Arrays.sort(arr1);
Arrays.sort(arr2);
for(int i = 0; i < arr1.length; i++) {
if(arr1[i] != arr2[i]) {
return false;
}
}
return true;
}
}
输出
true
true
false
O(n)的解法
因为组成变位词的字符是如出一辙的, 所以咱们能够先统计每一个字符串中各个字符出现的次数, 而后看这两个字符串中各字符出现次数是否同样。若是是,则它们是一对变位词。 这须要开一个辅助数组来保存各字符的出现次数。咱们能够开一个大小是256的整数数组, 遍历第一个字符串时,将相应字符出现的次数加1;遍历第二个字符串时, 将相应字符出现的次数减1。最后若是数组中256个数都为0,说明两个字符串是一对变位词。 (第1个字符串中出现的字符都被第2个字符串出现的字符抵消了), 若是数组中有一个不为0,说明它们不是一对变位词。
package cglib;
public class jiekou {
public static void main(String[] args) {
// TODO Auto-generated method stub
System.out.println(anagram("silent", "listen"));
//System.out.println(anagram("", ""));
//System.out.println(anagram("silent", "liste"));
}
private static boolean anagram(String s1,String s2){
int[] nums = new int[26];
char[] s1_char = s1.toCharArray();
char[] s2_char = s2.toCharArray();
int s1_length = s1_char.length;
int s2_length = s2_char.length;
if(s1_length != s2_length){
return false;
}
for(int i=0; i<s1_length; i++){
System.out.println("s1的s1_char[i]="+s1_char[i]);
int index = s1_char[i] - 'a';
System.out.println("s1的index="+index);
nums[index]++;
System.out.println("s1的nums[index]="+nums[index]);
}
for(int i=0; i<s1_length; i++){
System.out.println("s2的s2_char[i]="+s2_char[i]);
int index = s2_char[i] - 'a';
System.out.println("s2的index="+index);
nums[index]--;
System.out.println("s2的nums[index]="+nums[index]);
}
for(int i=0; i<nums.length; i++){
System.out.println("nums的i="+i);
System.out.println("nums[i]="+nums[i]);
if(nums[i]>0) return false;
}
return true;
}
}
输出:
s1的s1_char[i]=s s1的index=18 s1的nums[index]=1 s1的s1_char[i]=i s1的index=8 s1的nums[index]=1 s1的s1_char[i]=l s1的index=11 s1的nums[index]=1 s1的s1_char[i]=e s1的index=4 s1的nums[index]=1 s1的s1_char[i]=n s1的index=13 s1的nums[index]=1 s1的s1_char[i]=t s1的index=19 s1的nums[index]=1 s2的s2_char[i]=l s2的index=11 s2的nums[index]=0 s2的s2_char[i]=i s2的index=8 s2的nums[index]=0 s2的s2_char[i]=s s2的index=18 s2的nums[index]=0 s2的s2_char[i]=t s2的index=19 s2的nums[index]=0 s2的s2_char[i]=e s2的index=4 s2的nums[index]=0 s2的s2_char[i]=n s2的index=13 s2的nums[index]=0 nums的i=0 nums[i]=0 nums的i=1 nums[i]=0 nums的i=2 nums[i]=0 nums的i=3 nums[i]=0 nums的i=4 nums[i]=0 nums的i=5 nums[i]=0 nums的i=6 nums[i]=0 nums的i=7 nums[i]=0 nums的i=8 nums[i]=0 nums的i=9 nums[i]=0 nums的i=10 nums[i]=0 nums的i=11 nums[i]=0 nums的i=12 nums[i]=0 nums的i=13 nums[i]=0 nums的i=14 nums[i]=0 nums的i=15 nums[i]=0 nums的i=16 nums[i]=0 nums的i=17 nums[i]=0 nums的i=18 nums[i]=0 nums的i=19 nums[i]=0 nums的i=20 nums[i]=0 nums的i=21 nums[i]=0 nums的i=22 nums[i]=0 nums的i=23 nums[i]=0 nums的i=24 nums[i]=0 nums的i=25 nums[i]=0 true