背景:今天接到一个有关江苏省企业信息汇总的excel文件,大小约为48M,包含了三张表,总数据量约为48万条。按照要求须要筛选出地址为徐州市的企业。
分析:此excel文件没有设置字段,也没有进行相应的排序,各个市的信息是无序排列的,索引值仅告知咱们企业的总数。因为对excel表格并不熟悉,且将48w条数据写入数据库在进行操做并导出会很麻烦,因此我首先想到的是使用SQL语句对excel文件进行查询。
工具:excel表格2016版本
具体作法:
正则表达式
-
对原始数据进行必定处理,将所需表名以及字段名更换成英文,虽然支持utf8编码格式,可是对于中文的处理仍是须要加上引号。sql
-
新建一个excel文件,在上方菜单栏找到数据,并在数据选项下找到现有链接并打开。
数据库
-
点击浏览更多
工具 -
找到咱们所要处理的excel文件,由于处理的文件有能够有多个表格,因此会出现以下界面。
这里能够选择自动将首行列为标题,而后选中须要处理的表格,点击肯定。
编码 -
接下来,在下图界面选择属性
spa -
咱们在属性界面里面首先找到定义,在文本命令处能够获得当前表格的名字(即3处),选择表名后,在命令文本中输入SQL语句,便可对excel表格进行处理
3d -
按照分析咱们使用的语句是excel
select * from [ market_search$] where location like '%徐州%'; --这里的表名须要加上中括号,对字段location进行模糊查询,使用like并配合上正则表达式便可。
8. 最后在点击肯定便可,须要注意的是,这里你须要指定是否将筛选的内容生成新的表格
code