1,获得网页上的连接地址:
string matchString = @"<a[^>]+href=\s*(?:'(?<href>[^']+)'|""(?<href>[^""]+)""|(?<href>[^>\s]+))\s*[^>]*>";
2,获得网页的标题:
string matchString = @"<title>(?<title>.*)</title>";
3,去掉网页中的全部的html标记:
string temp = Regex.Replace(html, "<[^>]*>", ""); //html是一个要去除html标记的文档html
4, string matchString = @"<title>([\S\s\t]*?)</title>";
5,js去掉全部html标记的函数:
function delHtmlTag(str)
{
return str.replace(/<[^>]+>/g,"");//去掉全部的html标记
}函数