今天运行壹個小程序,功能是读取指定目录下的 SQL 脚本,并加载到内存中批量执行,以前的程序运行良好。可是今天相关开发人员更新了其中壹個 SQL 脚本,因而程序运行的时候就出错了,错误提示信息以下:批处理中出现错误: ORA-01756: 引号内的字符串没有正确结束。用 Notepad++ 打开看了下 SQL 脚本,没有发现明显的语法错误,再仔细找了找包含单引号和双引号的语句,也没有看到语句未正确结束的地方。因而有点困惑,开始启动 Eclipse 的 Debug 模式仔细分析,并调低了日志级别到 DEBUG,将全部解析出来的 SQL 语句打印至控制台。 java
结果在日志中发现有的 SQL 语句解析以后竟然是乱码,截取部份内容以下所示: sql
4,2,'?占淇迹罩湛贾? from TRUSTDB.TRUST_PRDT_MEM_SET t很明显的,数字2后面的部分只有壹個开始的单引号,而没有关闭的单引号,看来极有多是这段乱码引发的,上述内容在原始的 SQL 文件(GBK 编码)中实际是这样的:
4,2,'日间开始,日终开始以前' from TRUSTDB.TRUST_PRDT_MEM_SET t不知道为何通过 Java 解析以后会变成壹串乱码。找到问题的所在,修改的时候直接把“日间开始,日终开始以前”中间的全角逗号改为了半角逗号,问题就宣告解决,同时我还注意到在这個 SQL 脚本中,还有其它地方也使用到了全角的逗号,可是那些地方没有出问题,独独此处报错了,真是奇怪。在我看来,这個修复方法实在不太理想,不知道是否还有更好的方法。另外,附上个人 SQL 文件解析代码以下。
List<String> loadSql(String filepath) throws Exception { List<String> sqls = new ArrayList<String>(); StringBuffer sb = new StringBuffer(); byte[] buff = new byte[1024]; int byteRead = 0; LOGGER.debug("Start parse sql file [" + filepath + "]."); InputStream sqlFileIn = ClasspathResourceLoader.getResourceAsStream(filepath); //开始读取文件内容 while ((byteRead = sqlFileIn.read(buff)) != -1) { sb.append(new String(buff, 0, byteRead)); } //将读取到的字符串以换行符分割 String[] sqlArr = sb.toString().split("(;\\s*\\r\\n)|(;\\s*\\n)"); for (int i = 0; i < sqlArr.length-1; i++) { //将每個独立语句中的注释和末尾的分号去掉,只保留语句内容 String sql = sqlArr[i].replaceAll("--.*", "").replaceAll(";", " ").trim(); if (!sql.equals("")) { sqls.add(sql); } } LOGGER.debug("sql list=" + sqls); return sqls; }目前这個问题暂存,待往后有更好的方法时我会回过头来继续补充完善。其实有個更简单的办法找到 SQL 语句中出错的地方,就是把日志中解析以后输出的 SQL 语句复制粘贴到 PL/SQL Developer 的编辑器中,观察这些语句的语法染色,一般来说,若是由于单引号或者双引号不匹配引起了语句错误,在编辑器里显示出来的效果就会有点不大壹样。咱们只须要从代码尾部开始往上找到那個不壹样的地方,而后修改掉它,就很容易解决问题了。