继上次说的关键词展现存在的几点问题与修改的计划以后,这周作了以下改进:数据库
1、关键词展现更具备分析性。工具
相比以前统计全部政策中出现频率最高的关键词,如今加入了时间范围选择功能和政策发布部门功能。spa
政府部门的分类方面,国家级的是按照国务院标准部门进行分类,河北省的包括河北省科技厅和11个市。用户能够选择某个部门,对该部门出台的科技政策进行关键词分析。3d
经过比较发现,不一样时期,不一样部门出台的科技政策关键词有较好的区分度,进一步具备可分析性。blog
存在的问题在于:事件
1. 数据库中的科技政策不完整,而且分布不均。最严重的的在于各市出台的科技政策文件,基本都处于缺失状态,并不利于统计。方法
2. 一个政策可能由有多个部门联合发布。一个部门有多个名称,如“科技部”、“科学技术部”、“科技部办公厅”。这些在对部门进行分类处理的时候增长了障碍。im
2、新增科技服务业政策比重统计对比功能。技术
科技服务业有着普遍需求与良好前景。科技服务业的政策数量不断增多,经过对关键词进行分类,能够看出每一年科技服务业的政策在不一样服务领域所占的比重。d3
统计分类方法以下表所示:
展现效果以下所示:
3、新增政策实施效果评估模块。
政策工具是政策实施的具体手段,经过对不一样工具设置相应的核心关键词,再与政策中的关键词想比较,就能够分析出政策在不一样层面的着手力度。再结合经济统计年鉴等数据,就能够分析出政策的实施效果与影响力。
政策工具与关键词设置以下表所示:
在实现的时候,用户能够选择统计某个时间区间内,某个部门出台的科技政策,运用政策工具,从供给面、环境面和需求面三个层面进一步细分,统计各个子类下政策数量与所占比重。(目前的效果只是个构思,还未加入真是的数据。)
下面的三个图与政策工具的三个层面对应,在各个层面设置了不一样的评价指标,从本题库中统计得出。经过结合科技政策工具,作进一步的分析。(目前的效果只是个构思,还未加入真是的数据。)
具体的评价指标参考下表:
4、存在的问题
目前采起的方案是先对政策量化,而后再从多个本体指标来对比,从而探究科技政策的实施效果以及影响力。目前只作了两大类数据统计以后的显示的功能,并无作实际的对比,若是继续采起这个方案,对比的方法仍须要好好构思。
还有一种想法是对科技政策作非量化的分类,作句子级别的关联和分析以及主题挖掘。若是经过量化科技政策并不能很好的与年鉴数据或热点事件想结合,这种方案或许能够试一下。