JAVA正则表达式范例

时间 2019-11-24

标签 java 正则表达式范例栏目 Java 繁體版

原文原文链接

package com.simple.zhengze;

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Test {
   public static void main(String args[]) {
//     zhengZe0();
//     zhengZe1();
//     zhengZe2();
//     zhengZe3();
//     zhengZeExample1();
//     zhengZeExample2();
//     zhengZeExample3();
//     zhengZeExample4();
//     zhengZeExample6();
//     zhengZeExample7();
//     zhengZeExample8();
//     zhengZeExample9();
//     zhengZeExample10();
//     zhengZeExample11();
//     zhengZeExample12();
//     zhengZeExample13();
//     zhengZeExample14();
     zhengZeExample15();
//     zhengZeExample16();
  }

   /**
    * 例子程序：替换字符串中的以"["开头，以"]"结尾的字符还包括|
    */
   public static void zhengZe0() {
    String str = " [单式]    1,1,8,8,1,4:11|[单式]    1,0,0,0,0,2:01|[单式]    7,5,3,3,2,5:12|[单式]    0,6,3,9,6,8:10|[单式]    8,6,8,1,9,8:05";
    Pattern pattern = Pattern.compile( "\\|?\\[\\S*\\]");
    Matcher matcher = pattern.matcher(str);

    System.out.println(matcher.replaceAll(""));
  }
   /**
    * 例子程序：替换字符串中的以"["开头，以"]"结尾的字符还包括先后的空格也都被替换掉
    */
   public static void zhengZe1() {
    String str = " [单式]    1,1,8,8,1,4:11|[单式]    1,0,0,0,0,2:01|[单式]    7,5,3,3,2,5:12|[单式]    0,6,3,9,6,8:10|[单式]    8,6,8,1,9,8:05";
    Pattern pattern = Pattern.compile( "\\s*\\|?\\[\\S*\\]\\s*");
    Matcher matcher = pattern.matcher(str);

    System.out.println(matcher.replaceAll( " "));
  }
   /**
    * 例子程序：判断该字符串是否是以 "head" 开头，以 "end" 结尾
    */
   public static void zhengZe2() {
    String regexp = "^head\\sbody\\s*end$";
    String str = "head body    end";
    Pattern pattern = Pattern.compile(regexp);
    Matcher matcher = pattern.matcher(str);
    System.out.println(matcher.matches());

  }
   /**
    * 例子程序：
    */
   public static void zhengZe3() {
    String str = " [单式]    1,1,8,8,1,4:11|[单式]    1,0,0,0,0,2:01|[单式]    7,5,3,3,2,5:12|[单式]    0,6,3,9,6,8:10|[单式]    8,6,8,1,9,8:05";
    Pattern pattern = Pattern.compile( "\\s*\\|?\\[\\S*\\]\\s*");
    Matcher matcher = pattern.matcher(str);

    System.out.println(matcher.matches());
  }

   /**
    * 正则式是最简单的能准确匹配一个给定String的模式,模式与要匹配的文本是等价的.静态的Pattern.matches方法用于比较一个String是否匹配一个给定模式.例程以下:
    */
   public static void zhengZeExample1() {
    String data = " java    ";
     boolean result = Pattern.matches( "^\\s*java\\s*$", data);
    System.out.println(result);
  }

   /**
    * 模式是”m(o+)n”,它表示mn中间的o能够重复一次或屡次,所以moon,mon,mooon能匹配成功,而mono在n后多了一个o,和模式匹配不上.
    * 注: +表示一次或屡次;?表示0次或一次;*表示0次或屡次.
    */
   public static void zhengZeExample2() {
    String[] dataArr = { "moon", "mon", "mn", "mono" };

     for (String str : dataArr) {
      String patternStr = "m(o+)n.?";

       boolean result = Pattern.matches(patternStr, str);
       if (result) {
        System.out.println( "字符串" + str + "匹配模式" + patternStr + "成功");
      } else {
        System.out.println( "字符串" + str + "匹配模式" + patternStr + "失败");
      }
    }
  }

   /**
    * 注:方括号中只容许的单个字符,模式“b[aeiou]n”指定,只有以b开头,n结尾,中间是a,e,i,o,u中任意一个的才能匹配上,因此数组的前五个能够匹配,后两个元素没法匹配.
    * 方括号[]表示只有其中指定的字符才能匹配.
    */
   public static void zhengZeExample3() {
    String[] dataArr = { "ban", "ben", "bin", "bon", "bun", "byn", "baen" };

     for (String str : dataArr) {
      String patternStr = "b[aeiou]n";

       boolean result = Pattern.matches(patternStr, str);
       if (result) {
        System.out.println( "字符串" + str + "匹配模式" + patternStr + "成功");
      } else {
        System.out.println( "字符串" + str + "匹配模式" + patternStr + "失败");
      }
    }
  }

   /**
    * 若是须要匹配多个字符,那么[]就不能用上了,这里咱们能够用()加上|来代替,()表示一组,|表示或的关系,模式b(ee|ea|oo)n就能匹配been,bean,boon等.
    * 所以前三个能匹配上,然后两个不能.
    */
   public static void zhengZeExample4() {
    String[] dataArr = { "been", "bean", "boon", "buin", "bynn" };

     for (String str : dataArr) {
      String patternStr = "b(ee|ea|oo)n";

       boolean result = Pattern.matches(patternStr, str);
       if (result) {
        System.out.println( "字符串" + str + "匹配模式" + patternStr + "成功");
      } else {
        System.out.println( "字符串" + str + "匹配模式" + patternStr + "失败");
      }
    }

  }

   /**
    * 模式\w+\d+表示的是以多个单字字符开头,多个数字结尾的字符串,所以前四个能匹配上,最后一个由于数字后还含有单字字符而不能匹配
    */
   public static void zhengZeExample6() {
    String[] dataArr = { "a100", "b20", "c30", "df10000", "gh0t" };

     for (String str : dataArr) {
      String patternStr = "^\\w?\\d+$";

       boolean result = Pattern.matches(patternStr, str);
       if (result) {
        System.out.println( "字符串" + str + "匹配模式" + patternStr + "成功");
      } else {
        System.out.println( "字符串" + str + "匹配模式" + patternStr + "失败");
      }
    }
  }

   /**
    * String类的split函数支持正则表达式,上例中模式能匹配”,”,单个空格,”;”中的一个,split函数能把它们中任意一个看成分隔符,将一个字符串劈分红字符串数组
    */
   public static void zhengZeExample7() {
    String str = "薪水,职位姓名;年龄性别";
    String[] dataArr = str.split( "[,\\s;]");
     for (String strTmp : dataArr) {
      System.out.println(strTmp);
    }
  }

   /**
    * Pattern是一个正则表达式经编译后的表现模式 ,它的split方法能有效劈分字符串.注意其和String.split()使用上的不一样.
    */
   public static void zhengZeExample8() {
    String str = "2007年12月11日";
    Pattern p = Pattern.compile( "[年月日]");
    String[] dataArr = p.split(str);
     for (String strTmp : dataArr) {
      System.out.print(strTmp);
    }
  }

   /**
    * 上例中,模式“(\d+)(元|人民币|RMB)”按括号分红了两组,第一组\d+匹配单个或多个数字,第二组匹配元,人民币,RMB中的任意一个,替换部分表示第一个组匹配的部分不变,其他组替换成￥.
    *
    * 替换后的str为￥10 ￥1000 ￥10000 ￥100000
    *
    */
   public static void zhengZeExample9() {
    String str = "10元 1000人民币 10000元 100000RMB";
    str = str.replaceAll( "(^|\\s+)", "￥");
    System.out.println(str);
    str = str.replaceAll( "(元|人民币|RMB)", "");
    System.out.println(str);
  }

   /**
    * System.out.println("替换后内容是" + sb.toString());
    */
   public static void zhengZeExample10() {
    Pattern p = Pattern.compile( "m(o+)n", Pattern.CASE_INSENSITIVE);
     // 用Pattern类的matcher()方法生成一个Matcher对象
    Matcher m = p.matcher( "moon mooon Mon mooooon Mooon");
    StringBuffer sb = new StringBuffer();
     // 使用find()方法查找第一个匹配的对象
     boolean result = m.find();
     // 使用循环找出模式匹配的内容替换之,再将内容加到sb里
     while (result) {
      m.appendReplacement(sb, "moon");
      result = m.find();
    }
     // 最后调用appendTail()方法将最后一次匹配后的剩余字符串加到sb里；
    m.appendTail(sb);
    System.out.println( "替换后内容是" + sb.toString());
  }

   /**
    * 除了用+表示一次或屡次,*表示0次或屡次,?表示0次或一次外,还能够用{}来指定精确指定出现的次数,X{2,5}表示X最少出现2次,最多出现5次;X{2,}表示X最少出现2次,多则不限;X{5}表示X只精确的出现5次.
    */
   public static void zhengZeExample11() {
    String[] dataArr = { "google", "gooogle", "gooooogle", "goooooogle", "ggle" };

     for (String str : dataArr) {
      String patternStr = "g(o{2,5})gle";

       boolean result = Pattern.matches(patternStr, str);
       if (result) {
        System.out.println( "字符串" + str + "匹配模式" + patternStr + "成功");
      } else {
        System.out.println( "字符串" + str + "匹配模式" + patternStr + "失败");
      }
    }
  }

   public static void zhengZeExample12() {
    String[] dataArr = { "Tan", "Tbn", "Tcn", "Ton", "Twn" };

     for (String str : dataArr) {
      String regex = "T[a-c]n";

       boolean result = Pattern.matches(regex, str);
       if (result) {
        System.out.println( "字符串" + str + "匹配模式" + regex + "成功");
      } else {
        System.out.println( "字符串" + str + "匹配模式" + regex + "失败");
      }
    }
  }

   /**
    * 正则表达式默认都是区分大小写的,使用了Pattern.CASE_INSENSITIVE则不对大小写进行区分.
    */
   public static void zhengZeExample13() {
    String patternStr = "ab";
    Pattern pattern = Pattern.compile(patternStr, Pattern.CASE_INSENSITIVE);

    String[] dataArr = { "ab", "Ab", "AB" };

     for (String str : dataArr) {
      Matcher matcher = pattern.matcher(str);

       if (matcher.find()) {
        System.out.println( "字符串" + str + "匹配模式" + patternStr + "成功");
      }
    }
  }

   /**
    * 注意这里要把复杂的模式写在前面,不然简单模式会先匹配上.
    */
   public static void zhengZeExample14() {
    String input = "职务=GM 薪水=50000 , 姓名=职业经理人 ; 性别=男    年龄=45 ";
    String patternStr = "(\\s*,\\s*)|(\\s*;\\s*)|(\\s+)";
    Pattern pattern = Pattern.compile(patternStr);

    String[] dataArr = pattern.split(input);

     for (String str : dataArr) {
      System.out.println(str);
    }
  }

   /**
    * 解析正则表达式中的文字,对应第一个小括号括起来的group1.
    */
   public static void zhengZeExample15() {
    String regex = "<(\\w+)>(\\w+)</(\\w+)>";
    Pattern pattern = Pattern.compile(regex);

    String input = "<name>Bill</name><salary>50000</salary><title>GM</title>";

    Matcher matcher = pattern.matcher(input);

     while (matcher.find()) {
      System.out.println(matcher.group(1) + ":" + matcher.group(2));
    }
  }
   /**
    * 将单词数字混合的字符串的单词部分大写.
    */
   public static void zhengZeExample16() {
    String regex = "([a-zA-Z]+[0-9]+)";
    Pattern pattern = Pattern.compile(regex);
    String input = "age45 salary500000 50000 title";
    Matcher matcher = pattern.matcher(input);
    StringBuffer sb = new StringBuffer();

     while (matcher.find()) {
      String replacement = matcher.group(1).toUpperCase();
      matcher.appendReplacement(sb, replacement);
    }
    matcher.appendTail(sb);

    System.out.println( "替换完的字串为" + sb.toString());   } }