背景 正则表达式
闲来无聊,抽空写篇博客对flex,bison这两个小工具进行介绍一下。工具自己的用途我不在此赘述。因为本身曾经作过配置文件的解析的工做,深知其中的艰辛与痛苦。flex,bion的出现,为本身解决这类问题打开了另一扇门。固然,若是拿flex,bison来解析我用到的这些配置文件,有点小题大作了。因此,这个地方,我选择了解析json文本。选择解析json文本的缘由是你们在平时作应用层工做时候确定会用获得,并且,json文本自己的格式并非太复杂。 json
本文在协做的过程当中,最初参考了costaxu的这篇文章(http://my.oschina.net/costaxu/blog/107714)。在此表示感谢。因为是做为探索性的尝试,并无彻底实现对json的解析,以及封装成为可供上层调用的库。但整个框架已经可以应用到实际的项目中。 框架
分词 函数
分词使用的是flex工具,其脚本以下:(文件名为json.fl) 工具
%{ #include "stdio.h" #include "json.tab.h" int yywrap(void) //自定义此函数,是应用程序彻底脱离对flex库的依赖 { return 1; //返回默认值1 } %} VALUE_INT [-]?[1-9]+[0-9]* VALUE_FLOAT [-]?[1-9]+[0-9]\.[0-9]+ VALUE_STRING [_a-zA-Z]+[_a-zA-Z0-9]+ IGNORE [ \t\r\n] %% \" return QUOTE; \, return COMMA; \[ return BRACE_LEFT; \] return BRACE_RIGHT; \{ return BRACEETS_LEFT; \} return BRACEETS_RIGHT; \: return COLON; {VALUE_STRING} yylval = strdup(yytext); return VALUE_STRING; {VALUE_FLOAT} return VALUE_FLOAT; {VALUE_INT} return VALUE_INT; {IGNORE} %%
目前,只对三种数据类型,int,float,string类型做了处理,并且string的正则表达式也有待改进。 flex
词法分析 spa
词法分析使用的是bison工具,其内容以下(文件名为json.y) .net
%{ #include <stdio.h> #include <string.h> void yyerror(const char* s) { printf("ERROR:%s\n",s); } int main() { FILE * infp = NULL; infp = fopen("config.file","r"); yyrestart(infp); yyparse(); fclose(infp); return 0; } %} %token QUOTE COMMA BRACE_LEFT BRACE_RIGHT BRACEETS_LEFT BRACEETS_RIGHT COLON VALUE_STRING VALUE_FLOAT VALUE_INT %% root: | BRACEETS_LEFT items BRACEETS_RIGHT ; items: | items COMMA item | item ; item: item_int | item_float | item_string | item_item ; item_int: QUOTE VALUE_STRING QUOTE COLON VALUE_INT { printf("Model item_int![Name:%s]\n",$2); } ; item_float: QUOTE VALUE_STRING QUOTE COLON VALUE_FLOAT { printf("Model item_float![Name:%s]\n",$2); } ; item_string: QUOTE VALUE_STRING QUOTE COLON QUOTE VALUE_STRING QUOTE { printf("Model item_string![Name:%s]\n",$2); } ; roots: | roots COMMA root | root ; item_item: QUOTE VALUE_STRING QUOTE COLON BRACE_LEFT roots BRACE_RIGHT { printf("Model item_item![Name:%s]\n",$2); } ;
备注,上面仅仅是对json文件进行语法分析,再此仅将json对的名字进行简单的打印。 rest
后记 code
依次使用以下命令便可完成对项目的编译工做。
flex json.fl bison -d json.y gcc -o lex.exe json.tab.c lex.yy.c
{ "people": [ { "firstName": "Brett", "lastName":"McLaughlin", "email": "aaaa" }, { "firstName": "Jason", "lastName":"Hunter", "email": "bbbb"}, { "firstName": "Elliotte", "lastName":"Harold", "email": "cccc" } ] }
而后,便可对此json文档进行解析。