使用flex,bison构建简单的json解析器

背景 正则表达式

    闲来无聊,抽空写篇博客对flex,bison这两个小工具进行介绍一下。工具自己的用途我不在此赘述。因为本身曾经作过配置文件的解析的工做,深知其中的艰辛与痛苦。flex,bion的出现,为本身解决这类问题打开了另一扇门。固然,若是拿flex,bison来解析我用到的这些配置文件,有点小题大作了。因此,这个地方,我选择了解析json文本。选择解析json文本的缘由是你们在平时作应用层工做时候确定会用获得,并且,json文本自己的格式并非太复杂。 json

      本文在协做的过程当中,最初参考了costaxu的这篇文章(http://my.oschina.net/costaxu/blog/107714)。在此表示感谢。因为是做为探索性的尝试,并无彻底实现对json的解析,以及封装成为可供上层调用的库。但整个框架已经可以应用到实际的项目中。 框架

分词 函数

   分词使用的是flex工具,其脚本以下:(文件名为json.fl) 工具

      

%{
#include "stdio.h"
#include "json.tab.h"
int yywrap(void)	        //自定义此函数,是应用程序彻底脱离对flex库的依赖
{
	return 1;		//返回默认值1
}
%}

VALUE_INT	   	    [-]?[1-9]+[0-9]*			
VALUE_FLOAT                 [-]?[1-9]+[0-9]\.[0-9]+
VALUE_STRING                [_a-zA-Z]+[_a-zA-Z0-9]+
IGNORE         	            [ \t\r\n]

%%
\"				return QUOTE;
\,				return COMMA;
\[     			        return BRACE_LEFT; 
\]				return BRACE_RIGHT; 
\{				return BRACEETS_LEFT; 
\}				return BRACEETS_RIGHT; 
\:				return COLON; 
{VALUE_STRING}	yylval = strdup(yytext); return VALUE_STRING;
{VALUE_FLOAT}	return VALUE_FLOAT;
{VALUE_INT}		return VALUE_INT;
{IGNORE}
%%



目前,只对三种数据类型,int,float,string类型做了处理,并且string的正则表达式也有待改进。 flex

词法分析 spa

词法分析使用的是bison工具,其内容以下(文件名为json.y) .net

%{
#include <stdio.h>
#include <string.h>

void yyerror(const char* s)
{
	printf("ERROR:%s\n",s);
}

int main()
{
	FILE * infp = NULL;
	infp = fopen("config.file","r");
	yyrestart(infp);
	yyparse();
	fclose(infp);
	return 0;
}

%}

%token QUOTE COMMA BRACE_LEFT BRACE_RIGHT BRACEETS_LEFT BRACEETS_RIGHT COLON VALUE_STRING VALUE_FLOAT VALUE_INT

%%
root: 
	|
	BRACEETS_LEFT items BRACEETS_RIGHT
	;
	
items: 
	|
	items COMMA item
	|
	item
	;
	
item: 
	item_int
	|
	item_float
	|
	item_string
	|
	item_item
	;
	
item_int: QUOTE VALUE_STRING QUOTE COLON VALUE_INT
	{
		printf("Model item_int![Name:%s]\n",$2);
	}
	;
	
item_float: QUOTE VALUE_STRING QUOTE COLON VALUE_FLOAT
	{
		printf("Model item_float![Name:%s]\n",$2);
	}
	;
	
item_string: QUOTE VALUE_STRING QUOTE COLON  QUOTE VALUE_STRING QUOTE
	{
		printf("Model item_string![Name:%s]\n",$2);
	}
	;
	
roots:
	|
	roots COMMA root
	|
	root
	;
	
item_item: QUOTE VALUE_STRING QUOTE COLON  BRACE_LEFT roots BRACE_RIGHT
	{
		printf("Model item_item![Name:%s]\n",$2);
	}
	;


备注,上面仅仅是对json文件进行语法分析,再此仅将json对的名字进行简单的打印。 rest

后记 code

    依次使用以下命令便可完成对项目的编译工做。

    

flex json.fl
bison -d json.y

gcc -o lex.exe json.tab.c lex.yy.c



从百度百科拿下一段json文本,以下

{ 
"people": [
                { "firstName": "Brett", "lastName":"McLaughlin", "email": "aaaa" },
                { "firstName": "Jason", "lastName":"Hunter", "email": "bbbb"},
                { "firstName": "Elliotte", "lastName":"Harold", "email": "cccc" }
            ]
}



保存为,bison中所写的config.file文件。

而后,便可对此json文档进行解析。

相关文章
相关标签/搜索