在作网络爬虫的时候会遇到json数据格式的数据包,若是返回的是一个json格式的文件,可使用正则表达式
Python Yaml包处理数据,不须要再使用正则表达式匹配了,使用实例如json
https://maps-api-ssl.google.com/maps/suggest?q=hello 这个地址,咱们须要query对应的数据项.api
相关代码以下:网络
# -*- coding: utf-8 -*- import yaml import urllib2 address = 'https://maps-api-ssl.google.com/maps/suggest?q=hello' string_data = urllib2.urlopen(address).read().replace(':', ': ') dict_data = yaml.load(string_data) for item in dict_data['suggestion']: print item['query']