使用RegularExpressions去除HTML标签的字符串

一、需求场景

  由于须要作一个推送数据的服务,须要调用webservice,因为某种缘由须要使用用http发送soap请求,而推送的数据是json格式的,在测试过程当中发现请求失败,服务端webservice返回400错误。返回400错误,应该就是请求的数据格式不对,因为我这个状况特殊,请求的数据既要可以格式化为xml格式,里面某个节点里的内容还要可以正确格式化为json字符串,发现请求的数据里有HTML标签,须要过滤掉再请求。web

二、实现功能

  使用RegularExpressions正则表达式:正则表达式

  .   匹配除 "\n" 以外的任何单个字符。json

  *  匹配前面的子表达式零次或屡次。测试

  ?  匹配前面的子表达式零次或一次。spa

       只要把文章的"<.*?>"替换为String.Empty便可。code

 

       代码实现 xml

using System.Text.RegularExpressions;

public static string RemoveHtmlTag(string articleString)
{
      return Regex.Replace(articleString, "<.*?>", string.Empty);
}       
相关文章
相关标签/搜索