最近用阿里的Druid的SQL parser来解析SQL语句。在此记录下研究:
调用它来解析出AST语意树通常这么写(针对MySQL):java
MySqlStatementParser parser = new MySqlStatementParser(sql); List<SQLStatement> statementList = parser.parseStatementList(); for(SQLStatement statement:statementList){ MySqlSchemaStatVisitor visitor = new MySqlSchemaStatVisitor(); statemen.accept(visitor); }
对于每个SQL请求(可能包含多语句),须要先新建一个MySqlStatementParser。注意,MySqlStatementParser 不是线程安全的,因此一种作法是针对每一个session的请求,须要新建一个MySqlStatementParser。
那么这个初始化过程到底是怎样的呢?涉及到哪些类?mysql
涉及到的类以下所示:
SQL解析能够分为三层:语句解析->表达式解析->词法解析。对应的主要类分别是MySqlStatementParser,MySqlExprParser,MySqlLexer。能够说,MySqlLexer是解析出每一个词的词义,表达式由词组成,MySqlExprParser用来解析出不一样表达式的含义。多个表达式和词组成完整的语句,这个由MySqlStatementParser解析。
首先看MySqlStatementParser的结构:
git
接着是MySqlStatementParser的MySqlExprParser的结构:
sql
最后是MySqlLexer:
数据库
初始化MySqlStatementParser:
MySqlStateMentParser.java:缓存
public MySqlStatementParser(String sql){ super(new MySqlExprParser(sql)); }
会新建MySqlExprParser:
MySqlExprParser.java安全
public MySqlExprParser(String sql){ this(new MySqlLexer(sql)); //读取第一个有效词 this.lexer.nextToken(); }
会新建MySqlLexer:
MySqlLexer.javamarkdown
public MySqlLexer(String input){ super(input); //初始化MySQL关键词 super.keywods = DEFAULT_MYSQL_KEYWORDS; }
Lexer.javasession
public Lexer(String input){ this(input, null); } /** * @param input 输入SQL语句 * @param commentHandler 注释处理器 */ public Lexer(String input, CommentHandler commentHandler){ this(input, true); this.commentHandler = commentHandler; } /** * * @param input * @param skipComment 是否跳过注释 */ public Lexer(String input, boolean skipComment){ this.skipComment = skipComment; this.text = input; this.pos = -1; //读取第一个字符 scanChar(); } protected final void scanChar() { ch = charAt(++pos); }
初始化Lexer以后,回到MySqlExprParser的构造器,初始化KeyWords集合:函数
public final static Keywords DEFAULT_MYSQL_KEYWORDS; static { //MySQL关键词 Map<String, Token> map = new HashMap<String, Token>(); map.putAll(Keywords.DEFAULT_KEYWORDS.getKeywords()); map.put("DUAL", Token.DUAL); map.put("FALSE", Token.FALSE); map.put("IDENTIFIED", Token.IDENTIFIED); map.put("IF", Token.IF); map.put("KILL", Token.KILL); map.put("LIMIT", Token.LIMIT); map.put("TRUE", Token.TRUE); map.put("BINARY", Token.BINARY); map.put("SHOW", Token.SHOW); map.put("CACHE", Token.CACHE); map.put("ANALYZE", Token.ANALYZE); map.put("OPTIMIZE", Token.OPTIMIZE); map.put("ROW", Token.ROW); map.put("BEGIN", Token.BEGIN); map.put("END", Token.END); // for oceanbase & mysql 5.7 map.put("PARTITION", Token.PARTITION); map.put("CONTINUE", Token.CONTINUE); map.put("UNDO", Token.UNDO); map.put("SQLSTATE", Token.SQLSTATE); map.put("CONDITION", Token.CONDITION); DEFAULT_MYSQL_KEYWORDS = new Keywords(map); }
Keywords.java:
public final static Keywords DEFAULT_KEYWORDS; static { Map<String, Token> map = new HashMap<String, Token>(); map.put("ALL", Token.ALL); map.put("ALTER", Token.ALTER); map.put("AND", Token.AND); map.put("ANY", Token.ANY); map.put("AS", Token.AS); map.put("ENABLE", Token.ENABLE); map.put("DISABLE", Token.DISABLE); map.put("ASC", Token.ASC); map.put("BETWEEN", Token.BETWEEN); map.put("BY", Token.BY); map.put("CASE", Token.CASE); map.put("CAST", Token.CAST); map.put("CHECK", Token.CHECK); map.put("CONSTRAINT", Token.CONSTRAINT); map.put("CREATE", Token.CREATE); map.put("DATABASE", Token.DATABASE); map.put("DEFAULT", Token.DEFAULT); map.put("COLUMN", Token.COLUMN); map.put("TABLESPACE", Token.TABLESPACE); map.put("PROCEDURE", Token.PROCEDURE); map.put("FUNCTION", Token.FUNCTION); map.put("DELETE", Token.DELETE); map.put("DESC", Token.DESC); map.put("DISTINCT", Token.DISTINCT); map.put("DROP", Token.DROP); map.put("ELSE", Token.ELSE); map.put("EXPLAIN", Token.EXPLAIN); map.put("EXCEPT", Token.EXCEPT); map.put("END", Token.END); map.put("ESCAPE", Token.ESCAPE); map.put("EXISTS", Token.EXISTS); map.put("FOR", Token.FOR); map.put("FOREIGN", Token.FOREIGN); map.put("FROM", Token.FROM); map.put("FULL", Token.FULL); map.put("GROUP", Token.GROUP); map.put("HAVING", Token.HAVING); map.put("IN", Token.IN); map.put("INDEX", Token.INDEX); map.put("INNER", Token.INNER); map.put("INSERT", Token.INSERT); map.put("INTERSECT", Token.INTERSECT); map.put("INTERVAL", Token.INTERVAL); map.put("INTO", Token.INTO); map.put("IS", Token.IS); map.put("JOIN", Token.JOIN); map.put("KEY", Token.KEY); map.put("LEFT", Token.LEFT); map.put("LIKE", Token.LIKE); map.put("LOCK", Token.LOCK); map.put("MINUS", Token.MINUS); map.put("NOT", Token.NOT); map.put("NULL", Token.NULL); map.put("ON", Token.ON); map.put("OR", Token.OR); map.put("ORDER", Token.ORDER); map.put("OUTER", Token.OUTER); map.put("PRIMARY", Token.PRIMARY); map.put("REFERENCES", Token.REFERENCES); map.put("RIGHT", Token.RIGHT); map.put("SCHEMA", Token.SCHEMA); map.put("SELECT", Token.SELECT); map.put("SET", Token.SET); map.put("SOME", Token.SOME); map.put("TABLE", Token.TABLE); map.put("THEN", Token.THEN); map.put("TRUNCATE", Token.TRUNCATE); map.put("UNION", Token.UNION); map.put("UNIQUE", Token.UNIQUE); map.put("UPDATE", Token.UPDATE); map.put("VALUES", Token.VALUES); map.put("VIEW", Token.VIEW); map.put("SEQUENCE", Token.SEQUENCE); map.put("TRIGGER", Token.TRIGGER); map.put("USER", Token.USER); map.put("WHEN", Token.WHEN); map.put("WHERE", Token.WHERE); map.put("XOR", Token.XOR); map.put("OVER", Token.OVER); map.put("TO", Token.TO); map.put("USE", Token.USE); map.put("REPLACE", Token.REPLACE); map.put("COMMENT", Token.COMMENT); map.put("COMPUTE", Token.COMPUTE); map.put("WITH", Token.WITH); map.put("GRANT", Token.GRANT); map.put("REVOKE", Token.REVOKE); // MySql procedure: add by zz map.put("WHILE", Token.WHILE); map.put("DO", Token.DO); map.put("DECLARE", Token.DECLARE); map.put("LOOP", Token.LOOP); map.put("LEAVE", Token.LEAVE); map.put("ITERATE", Token.ITERATE); map.put("REPEAT", Token.REPEAT); map.put("UNTIL", Token.UNTIL); map.put("OPEN", Token.OPEN); map.put("CLOSE", Token.CLOSE); map.put("CURSOR", Token.CURSOR); map.put("FETCH", Token.FETCH); map.put("OUT", Token.OUT); map.put("INOUT", Token.INOUT); DEFAULT_KEYWORDS = new Keywords(map); }
以后,回到构造MySqlStatementParser:
调用父类方法初始化:
SQLStatementParser.java
public SQLStatementParser(SQLExprParser exprParser){ super(exprParser.getLexer(), exprParser.getDbType()); this.exprParser = exprParser; }
SQLParser.java
public SQLParser(Lexer lexer, String dbType){ this.lexer = lexer; this.dbType = dbType; }
至此,初始化完成