使用YQL解决让前端爬取网页并解析

今天写代码的时候,为了节省后端性能,就想用前端浏览器去爬取一个网页并解析出其中的部份内容。html

由于涉及到跨域,因此就须要使用到JSONP,可是JSONP须要返回JSON格式,而咱们是须要爬取一个网页的内容,因此直接使用JSONP将会报错。因此咱们须要使用YQL来帮咱们将HTML内容解析成JSON格式。前端

 1 $.ajax({
 2    url: "http://query.yahooapis.com/v1/public/yql"
 3  , type:'jsonp'
 4  , data: {
 5      q: "select * from html where url=\"http://www.baidu.com/\"",
 6      format: "json"
 7    }
 8  , success:  (resp)=> {
 9      console.log(resp)
10    }
11 });

url是固定的,为yql服务的地址,format是你想要解析的格式。q是YQL语句,其中的html是转换前的格式。ajax

相关文章
相关标签/搜索