颇有段时间没写此系列了,今天咱们来讲Trie树,Trie树的名字有不少,好比字典树,前缀树等等。node
一:概念this
下面咱们有and,as,at,cn,com这些关键词,那么如何构建trie树呢?spa
从上面的图中,咱们或多或少的能够发现一些好玩的特性。code
第一:根节点不包含字符,除根节点外的每个子节点都包含一个字符。orm
第二:从根节点到某一节点,路径上通过的字符链接起来,就是该节点对应的字符串。内存
第三:每一个单词的公共前缀做为一个字符节点保存。字符串
二:使用范围get
既然学Trie树,咱们确定要知道这玩意是用来干吗的。hash
第一:词频统计。it
可能有人要说了,词频统计简单啊,一个hash或者一个堆就能够打完收工,但问题来了,若是内存有限呢?还能这么
玩吗?因此这里咱们就能够用trie树来压缩下空间,由于公共前缀都是用一个节点保存的。
第二: 前缀匹配
就拿上面的图来讲吧,若是我想获取全部以"a"开头的字符串,从图中能够很明显的看到是:and,as,at,若是不用trie树,
你该怎么作呢?很显然朴素的作法时间复杂度为O(N2) ,那么用Trie树就不同了,它能够作到h,h为你检索单词的长度,
能够说这是秒杀的效果。
举个例子:现有一个编号为1的字符串”and“,咱们要插入到trie树中,采用动态规划的思想,将编号”1“计入到每一个途径的节点中,
那么之后咱们要找”a“,”an“,”and"为前缀的字符串的编号将会垂手可得。
三:实际操做
到如今为止,我想你们已经对trie树有了大概的掌握,下面咱们看看如何来实现。
package Algorithm; public class Trie { private int SIZE=26; private TrieNode root;//字典树的根 Trie(){//初始化字典树 root=new TrieNode(); } private class TrieNode{//字典树节点 private int num;//有多少单词经过这个节点,即节点字符出现的次数 private TrieNode[] son;//全部的儿子节点 private boolean isEnd;//是否是最后一个节点 private char val;//节点的值 TrieNode(){ num=1; son=new TrieNode[SIZE]; isEnd=false; } } //创建字典树 public void insert(String str){//在字典树中插入一个单词 if(str==null||str.length()==0){ return; } TrieNode node=root; char[]letters=str.toCharArray(); for(int i=0,len=str.length();i<len;i++){ int pos=letters[i]-'a'; if(node.son[pos]==null){ node.son[pos]=new TrieNode(); node.son[pos].val=letters[i]; }else{ node.son[pos].num++; } node=node.son[pos]; } node.isEnd=true; } //计算单词前缀的数量 public int countPrefix(String prefix){ if(prefix==null||prefix.length()==0){ return-1; } TrieNode node=root; char[]letters=prefix.toCharArray(); for(int i=0,len=prefix.length();i<len;i++){ int pos=letters[i]-'a'; if(node.son[pos]==null){ return 0; } else{ node=node.son[pos]; } } return node.num; } //在字典树中查找一个彻底匹配的单词. public boolean has(String str){ if(str==null||str.length()==0){ return false; } TrieNode node=root; char[]letters=str.toCharArray(); for(int i=0,len=str.length();i<len;i++){ int pos=letters[i]-'a'; if(node.son[pos]!=null){ node=node.son[pos]; }else{ return false; } } return node.isEnd; } //前序遍历字典树. public void preTraverse(TrieNode node){ if(node!=null){ System.out.print(node.val+"-"); for(TrieNode child:node.son){ preTraverse(child); } } } public TrieNode getRoot(){ return this.root; } public static void main(String[]args){ Trie tree=new Trie(); String[]strs={"banana","band","bee","absolute","acm",}; String[]prefix={"ba","b","band","abc",}; for(String str:strs){ tree.insert(str); } System.out.println(tree.has("abc")); tree.preTraverse(tree.getRoot()); System.out.println(); //tree.printAllWords(); for(String pre:prefix){ int num=tree.countPrefix(pre); System.out.println(pre+""+num); } } }