网页解析包 Nokogiri

时间 2019-11-20

标签网页解析 nokogiri 栏目 HTML 繁體版

原文原文链接

网页解析

实际中，咱们常常须要对网页内容进行解析，上文中介绍了两种解析方法，其中一种须要用正则表达式解析，另外一种须要利用已经写好的网页解析包 Nokogiri。css

本文只是对 Nokogiri 进行分析，详细介绍还请参见 Nokogiri官网以及相关博客介绍 “Parsing HTML with Nokogiri”html

require 'nokogiri'
require 'open-uri'

page = Nokogiri::HTML(open("http://en.wikipedia.org/")) 
puts page.class   # => Nokogiri::HTML::Document

简要介绍集中css使用方法，详细方法参见以上博客正则表达式

本文内容均来自：ruby