js 正则匹配（去掉html标签）

时间 2019-11-11

原文原文链接

1，获得网页上的连接地址：html

string matchString = @"<a[^>]+href=\s*(?:'(?<href>^']+)'|""(?<href>[^""]+)""|(?<href>[^>\s]+))\s*[^>]*>";

2，获得网页的标题：函数

string matchString = @"<title>(?<title>.*)</title>";

3，去掉网页中的全部的html标记：code

string temp = Regex.Replace(html, "<[^>]*>", ""); //html是一个要去除html标记的文档htm

4, string matchString = @"<title>([\S\s\t]*?)</title>";
5, js去掉全部html标记的函数：rem

function delHtmlTag(str)
{
      return str.replace(/<[^>]+>/g,"");//去掉全部的html标记
}

6. 统计字数文档

t = $('.remarktext').html().replace(/<[^>]+>/g,"").length;