Weekly Contest 140的 Bigram 分词:code
给出第一个词
first
和第二个词second
,考虑在某些文本text
中可能以 "first second third
" 形式出现的状况,其中second
紧随first
出现,third
紧随second
出现。索引对于每种这样的状况,将第三个词 "
third
" 添加到答案中,并返回答案。leetcode示例1:get
输入:text = "alice is a good girl she is a good student", first = "a", second = "good" 输出:["girl","student"]示例2:it
输入:text = "we will we will rock you", first = "we", second = "will" 输出:["we","rock"]提示:test
1 <= text.length <= 1000
text
由一些用空格分隔的单词组成,每一个单词都由小写英文字母组成1 <= first.length, second.length <= 10
first
和second
由小写英文字母组成
本题须要注意如下两点:List
first second third
三个单词是要连续出现的,例如循环
输入:text = "alice is a good girl she is a really good student", first = "a", second = "good" 输出:["girl"]
first second third
三个单词中的third
多是下一次循环的first
,例如示例2/** * 5083. Bigram 分词 * @param text * @param first * @param second * @return */ public String[] findOcurrences(String text, String first, String second) { // 按空格分割单词 String[] words = text.split(" "); List<String> list = new ArrayList<>(); // 匹配第一个单词的索引 int firstIndex = -1; // 匹配第二个单词的索引 int secondIndex = -1; for (int i = 0; i < words.length; i++) { String word = words[i]; if (firstIndex >= 0 && secondIndex > 0) { // 判断前两个单词是否已经匹配 firstIndex = -1; // 重置索引 secondIndex = -1; // 重置索引 list.add(word); } // 判断是否为第二个单词,判断条件为 // 1. 当前单词与第二个单词相同 // 2. 第一个单词已经匹配 // 3. 第二个单词紧跟着第一个单词以后出现(secondIndex = firstIndex+1) // 此处先判断第二个单词是为了处理第三个单词为第一个单词的状况 if (word.equals(second) && firstIndex >= 0 && firstIndex == i - 1) { secondIndex = i; continue; // 匹配则中断当前循环 } else { // 第一个单词已经匹配,可是第二个单词不匹配,重置第一个单词的匹配结果 if (firstIndex >= 0) { firstIndex = -1; } } // 判断是否为第一个单词 // 1. 第一个单词未匹配 // 2. 当前单词与第一个单词相同 if (firstIndex < 0 && word.equals(first)) { firstIndex = i; continue; // 匹配则中断当前循环 } } String[] result = new String[list.size()]; return list.toArray(result); }