正则表达式匹配域名

咱们知道经过正则表达式能够实现对字符的匹配,正好项目中有个须要去掉图片url的域名部分,好比:http://xxx.yyy.cn/aa/bb.jpg,去掉后为aa/bb.jpg。这个用正则表达式能够轻松实现。html

表达式以下:java

^((http://)|(https://))?([a-zA-Z0-9]([a-zA-Z0-9\-]{0,61}[a-zA-Z0-9])?\.)+[a-zA-Z]{2,6}(/)

该表达式能够匹配以http://或者https://开头且支持域名中有中划线的状况,而且会匹配到域名后的第一个/.正则表达式

也就是咱们开题说的替换完的结果就是 aa/bb.jpg。url

简要说明:spa

()中表示一个子表达式,code

| 或关系,好比这里匹配http://或https://regexp

? 表示匹配 0 次或一次。 也就是若是要匹配 xxx.yyy.cn/aa/bb.jpg 这个连接匹配的结果也是 aa/bb.jpghtm

{n,m}限定表达式,最少n次,最大m次。n<=mblog

java处理:图片

public static void main(String[] args) {
        String pattern = "^((http://)|(https://))?([a-zA-Z0-9]([a-zA-Z0-9\\-]{0,61}[a-zA-Z0-9])?\\.)+[a-zA-Z]{2,6}(/)";
        Pattern p = Pattern.compile(pattern);
        String line = "https://xxx.yyy.cn/aa/bb.jpg";
        Matcher m = p.matcher(line);

        if(m.find()){
            //匹配结果
            System.out.println("=" + m.group());
        }
        //替换
        System.out.println(line.replaceAll(pattern, ""));
    }

 参考:http://www.cnblogs.com/LCX/archive/2008/07/16/1244481.html

  http://www.runoob.com/regexp/regexp-syntax.html

相关文章
相关标签/搜索