Java 学习（7）：java 日期时间 & 正则表达式

时间 2019-11-18

标签 java 学习日期时间正则表达式栏目 Java 繁體版

原文原文链接

目录html

--- 日期时间java

--- 正则表达式程序员

日期时间：java.util 包提供了 Date 类来封装当前的日期和时间。 Date 类提供两个构造函数来实例化 Date 对象。

构造函数：用于初始化对象，有如下两种方法：

1. Date( )  //使用当前日期和时间来初始化对象
2. Date(long millisec)  //接收一个参数，该参数是从1970年1月1日起的毫秒数

Date 对象创建之后，可调用如下方法：正则表达式

1    boolean after(Date date)：若当调用此方法的Date对象在指定日期以后返回true,不然返回false。
2    boolean before(Date date)：若当调用此方法的Date对象在指定日期以前返回true,不然返回false。
3    Object clone( )：返回此对象的副本。
4    int compareTo(Date date)：比较当调用此方法的Date对象和指定日期。二者相等时候返回0。调用对象在指定日期以前则返回负数。调用对象在指定日期以后则返回正数。
5    int compareTo(Object obj)：若obj是Date类型则操做等同于compareTo(Date) 。不然它抛出ClassCastException。
6    boolean equals(Object date)：当调用此方法的Date对象和指定日期相等时候返回true,不然返回false。
7    long getTime( )：返回自 1970 年 1 月 1 日 00:00:00 GMT 以来此 Date 对象表示的毫秒数。
8    int hashCode( )：返回此对象的哈希码值。
9    void setTime(long time)：用自1970年1月1日00:00:00 GMT之后time毫秒数设置时间和日期。
10    String toString( )：转换Date对象为String表示形式，并返回该字符串。

Date 对象方法

获取当前时间：

Date date = new Date();    // 初始化 Date 对象
System.out.println(date.toString());  // 使用 toString() 函数显示日期时间

比较两个日期，有如下三个方法：数组
- 使用 getTime() 方法获取两个日期（自1970年1月1日经历的毫秒数值），而后比较这两个值。
- 使用方法 before()，after() 和 equals()。例如，一个月的12号比18号早，则 new Date(99, 2, 12).before(new Date (99, 2, 18)) 返回true。
- 使用 compareTo() 方法，它是由 Comparable 接口定义的，Date 类实现了这个接口。

日期格式化：

SimpleDateFormat 是一个以语言环境敏感的方式来格式化和分析日期的类，它容许你选择任何用户自定义日期时间格式来运行。

import java.util.*;
import java.text.*;
 
public class DateDemo {
   public static void main(String args[]) {
 
      Date dNow = new Date( );
      SimpleDateFormat ft = new SimpleDateFormat ("E yyyy.MM.dd 'at' hh:mm:ss a zzz");  /*确立转换格式，其中 yyyy 是完整的公元年，MM 是月份，dd 是日期，HH:mm:ss 是时、分、秒。HH 是 24 小时制，而 hh 是 12 小时制。 */
 
      System.out.println("Current Date: " + ft.format(dNow));   //结果如： Current Date: Sun 2014.07.18 at 14:14:09 PM PDT

} }

时间模式字符串用来指定时间格式。以下：app

字母    描述                                   示例
G    纪元标记                            AD
y    四位年份                            2001
M    月份                                July or 07
d    一个月的日期                       10
h     A.M./P.M. (1~12)格式小时     12
H    一天中的小时 (0~23)             22
m    分钟数                             30
s    秒数                                     55
S    毫秒数                            234
E    星期几                          Tuesday
D    一年中的日子                     360
F    一个月中第几周的周几          2 (second Wed. in July)
w    一年中第几周                     40
W    一个月中第几周                      1
a    A.M./P.M. 标记                     PM
k    一天中的小时(1~24)              24
K     A.M./P.M. (0~11)格式小时      10
z    时区                                  Eastern Standard Time
'    文字定界符                            Delimiter
"    单引号                              `

日期和时间的格式化编码

printf 方法能够很轻松地格式化时间和日期。使用两个字母格式，它以 %t 开头而且如下面表格中的一个字母结尾。

转换符   说明                                示例
c       包括所有日期和时间信息       星期六 十月 27 14:21:20 CST 2007
F       "年-月-日"格式                          2007-10-27
D      "月/日/年"格式                          10/27/07
r     "HH:MM:SS PM"格式（12时制）  02:25:51 下午
T     "HH:MM:SS"格式（24时制）       14:28:16
R     "HH:MM"格式（24时制）           14:28

printf 格式化日期

import java.util.Date;
 
/**
 * 使用printf输出
 */
/**关键技术点
 * 使用java.io.PrintStream的printf方法实现C风格的输出
 * printf 方法的第一个参数为输出的格式,第二个参数是可变长的,表示待输出的数据对象
 */
public class Printf {
 
       public static void main(String[] args) {
              /*** 输出字符串 ***/
              // %s表示输出字符串，也就是将后面的字符串替换模式中的%s
              System.out.printf("%s", new Integer(1212));
              // %n表示换行
              System.out.printf("%s%n", "end line");
              // 还能够支持多个参数
              System.out.printf("%s = %s%n", "Name", "Zhangsan");
              // %S将字符串以大写形式输出
              System.out.printf("%S = %s%n", "Name", "Zhangsan");
              // 支持多个参数时，能够在%s之间插入变量编号，1$表示第一个字符串，3$表示第3个字符串
              System.out.printf("%1$s = %3$s %2$s%n", "Name", "san", "Zhang");
             
              /*** 输出boolean类型 ***/
              System.out.printf("true = %b; false = ", true);
              System.out.printf("%b%n", false);
 
              /*** 输出整数类型***/
              Integer iObj = 342;
              // %d表示将整数格式化为10进制整数
              System.out.printf("%d; %d; %d%n", -500, 2343L, iObj);
              // %o表示将整数格式化为8进制整数
              System.out.printf("%o; %o; %o%n", -500, 2343L, iObj);
              // %x表示将整数格式化为16进制整数
              System.out.printf("%x; %x; %x%n", -500, 2343L, iObj);
              // %X表示将整数格式化为16进制整数，而且字母变成大写形式
              System.out.printf("%X; %X; %X%n", -500, 2343L, iObj);
             
              /*** 输出浮点类型***/
              Double dObj = 45.6d;
              // %e表示以科学技术法输出浮点数
              System.out.printf("%e; %e; %e%n", -756.403f, 7464.232641d, dObj);
              // %E表示以科学技术法输出浮点数，而且为大写形式            
              System.out.printf("%E; %E; %E%n", -756.403f, 7464.232641d, dObj);
              // %f表示以十进制格式化输出浮点数
              System.out.printf("%f; %f; %f%n", -756.403f, 7464.232641d, dObj);
              // 还能够限制小数点后的位数
              System.out.printf("%.1f; %.3f; %f%n", -756.403f, 7464.232641d, dObj);
             
              /*** 输出日期类型***/
              // %t表示格式化日期时间类型，%T是时间日期的大写形式，在%t以后用特定的字母表示不一样的输出格式
              Date date = new Date();
              long dataL = date.getTime();
              // 格式化年月日
              // %t以后用y表示输出日期的年份（2位数的年，如99）
              // %t以后用m表示输出日期的月份，%t以后用d表示输出日期的日号
              System.out.printf("%1$ty-%1$tm-%1$td; %2$ty-%2$tm-%2$td%n", date, dataL);
              // %t以后用Y表示输出日期的年份（4位数的年），
              // %t以后用B表示输出日期的月份的完整名， %t以后用b表示输出日期的月份的简称
              System.out.printf("%1$tY-%1$tB-%1$td; %2$tY-%2$tb-%2$td%n", date, dataL);
             
              // 如下是常见的日期组合
              // %t以后用D表示以 "%tm/%td/%ty"格式化日期
              System.out.printf("%1$tD%n", date);
              //%t以后用F表示以"%tY-%tm-%td"格式化日期
              System.out.printf("%1$tF%n", date);
             
              /*** 输出时间类型***/
              // 输出时分秒
              // %t以后用H表示输出时间的时（24进制），%t以后用I表示输出时间的时（12进制），
              // %t以后用M表示输出时间的分，%t以后用S表示输出时间的秒
              System.out.printf("%1$tH:%1$tM:%1$tS; %2$tI:%2$tM:%2$tS%n", date, dataL);
              // %t以后用L表示输出时间的秒中的毫秒
              System.out.printf("%1$tH:%1$tM:%1$tS %1$tL%n", date);
              // %t以后p表示输出时间的上午或下午信息
              System.out.printf("%1$tH:%1$tM:%1$tS %1$tL %1$tp%n", date);
             
              // 如下是常见的时间组合
              // %t以后用R表示以"%tH:%tM"格式化时间
              System.out.printf("%1$tR%n", date);
              // %t以后用T表示以"%tH:%tM:%tS"格式化时间
              System.out.printf("%1$tT%n", date);
              // %t以后用r表示以"%tI:%tM:%tS %Tp"格式化时间
              System.out.printf("%1$tr%n", date);
             
              /*** 输出星期***/
              // %t以后用A表示获得星期几的全称
              System.out.printf("%1$tF %1$tA%n", date);
              // %t以后用a表示获得星期几的简称
              System.out.printf("%1$tF %1$ta%n", date);
             
              // 输出时间日期的完整信息
              System.out.printf("%1$tc%n", date);
       }
}
/**
 *printf方法中,格式为"%s"表示以字符串的形式输出第二个可变长参数的第一个参数值;
 *格式为"%n"表示换行;格式为"%S"表示将字符串以大写形式输出;在"%s"之间用"n$"表示
 *输出可变长参数的第n个参数值.格式为"%b"表示以布尔值的形式输出第二个可变长参数
 *的第一个参数值.
 */
/**
 * 格式为"%d"表示以十进制整数形式输出;"%o"表示以八进制形式输出;"%x"表示以十六进制
 * 输出;"%X"表示以十六进制输出,而且将字母(A、B、C、D、E、F)换成大写.格式为"%e"表
 * 以科学计数法输出浮点数;格式为"%E"表示以科学计数法输出浮点数,并且将e大写;格式为
 * "%f"表示以十进制浮点数输出,在"%f"之间加上".n"表示输出时保留小数点后面n位.
 */
/**
 * 格式为"%t"表示输出时间日期类型."%t"以后用y表示输出日期的二位数的年份(如99)、用m
 * 表示输出日期的月份,用d表示输出日期的日号;"%t"以后用Y表示输出日期的四位数的年份
 * (如1999)、用B表示输出日期的月份的完整名,用b表示输出日期的月份的简称."%t"以后用D
 * 表示以"%tm/%td/%ty"的格式输出日期、用F表示以"%tY-%tm-%td"的格式输出日期.
 */
/**
 * "%t"以后用H表示输出时间的时(24进制),用I表示输出时间的时(12进制),用M表示输出时间
 * 分,用S表示输出时间的秒,用L表示输出时间的秒中的毫秒数、用P表示输出时间的是上午仍是
 * 下午."%t"以后用R表示以"%tH:%tM"的格式输出时间、用T表示以"%tH:%tM:%tS"的格式输出
 * 时间、用r表示以"%tI:%tM:%tS %Tp"的格式输出时间.
 */
/**
 * "%t"以后用A表示输出日期的全称,用a表示输出日期的星期简称.
 */

printf 格式化日期实例

若是你须要重复提供日期，那么利用这种方式来格式化它的每一部分就有点复杂了。所以，能够利用一个格式化字符串指出要被格式化的参数的索引。

索引必须紧跟在%后面，并且必须以$结束。例如：

import java.util.Date;
  
public class DateDemo {
 
   public static void main(String args[]) {
       // 初始化 Date 对象
       Date date = new Date();
        
       // 使用 toString() 显示日期和时间
       System.out.printf("%1$s %2$tB %2$td, %2$tY", 
                         "Due date:", date);  
   }
}

// 运行结果：Due date: February 09, 2014

能够使用 < 标志。它代表先前被格式化的参数要被再次使用。例如：

import java.util.Date;
  
public class DateDemo {
 
   public static void main(String args[]) {
       // 初始化 Date 对象
       Date date = new Date();
        
       // 显示格式化时间
       System.out.printf("%s %tB %<te, %<tY", 
                         "Due date:", date);
   }
}
// 运行结果：Due date: February 09, 2014

定义日期格式的转换符：可使日期经过指定的转换符生成新字符串。

import java.util.*;
  
public class DateDemo {
   public static void main(String args[]) {
       Date date=new Date();                                      
        //b的使用，月份简称  
        String str=String.format(Locale.US,"英文月份简称：%tb",date);       
        System.out.println(str);                                                                              
        System.out.printf("本地月份简称：%tb%n",date);  
        //B的使用，月份全称  
        str=String.format(Locale.US,"英文月份全称：%tB",date);  
        System.out.println(str);  
        System.out.printf("本地月份全称：%tB%n",date);  
        //a的使用，星期简称  
        str=String.format(Locale.US,"英文星期的简称：%ta",date);  
        System.out.println(str);  
        //A的使用，星期全称  
        System.out.printf("本地星期的简称：%tA%n",date);  
        //C的使用，年前两位  
        System.out.printf("年的前两位数字（不足两位前面补0）：%tC%n",date);  
        //y的使用，年后两位  
        System.out.printf("年的后两位数字（不足两位前面补0）：%ty%n",date);  
        //j的使用，一年的天数  
        System.out.printf("一年中的天数（即年的第几天）：%tj%n",date);  
        //m的使用，月份  
        System.out.printf("两位数字的月份（不足两位前面补0）：%tm%n",date);  
        //d的使用，日（二位，不够补零）  
        System.out.printf("两位数字的日（不足两位前面补0）：%td%n",date);  
        //e的使用，日（一位不补零）  
        System.out.printf("月份的日（前面不补0）：%te",date);  
   }
}

/* 输出结果为：
英文月份简称：May
本地月份简称：五月
英文月份全称：May
本地月份全称：五月
英文星期的简称：Thu
本地星期的简称：星期四
年的前两位数字（不足两位前面补0）：20
年的后两位数字（不足两位前面补0）：17
一年中的天数（即年的第几天）：124
两位数字的月份（不足两位前面补0）：05
两位数字的日（不足两位前面补0）：04
月份的日（前面不补0）：4      */

解析字符串为时间：SimpleDateFormat 类有一些附加的方法，特别是parse()，它试图按照给定的SimpleDateFormat 对象的格式化存储来解析字符串。

import java.util.*;
import java.text.*;
  
public class DateDemo {
 
   public static void main(String args[]) {
      SimpleDateFormat ft = new SimpleDateFormat ("yyyy-MM-dd"); 
 
      String input = args.length == 0 ? "1818-11-11" : args[0]; 
 
      System.out.print(input + " Parses as "); 
 
      Date t; 
 
      try { 
          t = ft.parse(input); 
          System.out.println(t); 
      } catch (ParseException e) { 
          System.out.println("Unparseable using " + ft); 
      }
   }
}

parse 解析时间实例

休眠 sleep()：使当前线程进入停滞状态（阻塞当前线程），让出CPU的使用、目的是不让当前线程独自霸占该进程所获的CPU资源，以留必定时间给其余线程执行的机会。ide

import java.util.*;
  
public class SleepDemo {
   public static void main(String args[]) {
      try { 
         System.out.println(new Date( ) + "\n"); 
         Thread.sleep(1000*3);   // 休眠3秒
         System.out.println(new Date( ) + "\n"); 
      } catch (Exception e) { 
          System.out.println("Got an exception!"); 
      }
   }
}

休眠 3秒实例

测量时间：

import java.util.*;
  
public class DiffDemo {
 
   public static void main(String args[]) {
      try {
         long start = System.currentTimeMillis( );
         System.out.println(new Date( ) + "\n");
         Thread.sleep(5*60*10);
         System.out.println(new Date( ) + "\n");
         long end = System.currentTimeMillis( );
         long diff = end - start;
         System.out.println("Difference is : " + diff);
      } catch (Exception e) {
         System.out.println("Got an exception!");
      }
   }
}

测量时间（以毫秒记）

Calendar类

如何才能设置和获取日期数据的特定部分呢，好比说小时，日，或者分钟? 咱们又如何在日期的这些部分加上或者减去值呢? 答案是使用 Calendar 类。

Calendar类是一个抽象类，在实际使用时实现特定的子类的对象，建立对象的过程对程序员来讲是透明的，只须要使用getInstance方法 建立便可。

建立指定日期的 Calendar 类

Calendar c = Calendar.getInstance();//默认是当前日期
c.set(2009, 6-1, 12);  //建立一个表明2009年6月12日的Calendar对象

Calendar 类对象字段类型：Calendar 类中用一下这些常量表示不一样的意义，jdk内的不少类其实都是采用的这种思想。

常量                                        描述
Calendar.YEAR                         年份
Calendar.MONTH                  月份
Calendar.DATE                     日期
Calendar.DAY_OF_MONTH  日期，和上面的字段意义彻底相同
Calendar.HOUR                  12小时制的小时
Calendar.HOUR_OF_DAY    24小时制的小时
Calendar.MINUTE                   分钟
Calendar.SECOND                   秒
Calendar.DAY_OF_WEEK      星期几

Calendar 类对象字段类型

Calendar 类对象信息的设置函数

set 设置：
 利用年月日： public final void set(int year,int month,int date)
     /* eg：Calendar c1 = Calendar.getInstance();  // 建立一个 Calender 对象
            c1.set(2009, 6 - 1, 12);   //设置 c1 的年月日 分别设这为：200九、六、12   */
  利用字段设置：public void set(int field,int value)
     /* eg: c1.set(Calendar.DATE, 10);  // 日期为： 10号，其它全部的数值会被从新计算
 c1.set(Calendar.YEAR,2008); // 年份为： 2008， 其余全部数值会被从新计算 */

Add 设置:

Calendar c1 = Calendar.getInstance();
c1.add(Calendar.DATE, 10); /*把c1对象的日期加上10，也就是c1也就表示为10天后的日期，其它全部的数值会被从新计算*/
c1.add(Calendar.DATE, -10); /*把c1对象的日期减去10，也就是c1也就表示为10天前的日期，其它全部的数值会被从新计算*/

Calendar类对象信息的得到： get 得到信息post

Calendar c1 = Calendar.getInstance();
int year = c1.get(Calendar.YEAR);   // 得到年份
int month = c1.get(Calendar.MONTH) + 1;  // 得到月份
int date = c1.get(Calendar.DATE);  // 得到日期
int hour = c1.get(Calendar.HOUR_OF_DAY);  // 得到小时
int minute = c1.get(Calendar.MINUTE);  // 得到分钟
int second = c1.get(Calendar.SECOND);  // 得到秒
int day = c1.get(Calendar.DAY_OF_WEEK); // 得到星期几（注意（这个与Date类是不一样的）：1表明星期日、2表明星期一、3表明星期二，以此类推）

GregorianCalendar类

Calendar 类实现了公历日历，GregorianCalendar 是 Calendar 类的一个具体实现。
Calendar 的 getInstance（）方法返回一个默认用当前的语言环境和时区初始化的 GregorianCalendar对象。
GregorianCalendar 定义了两个字段：AD和BC。这是表明公历定义的两个时代。

1    GregorianCalendar() ：在具备默认语言环境的默认时区内使用当前时间构造一个默认的 GregorianCalendar。
2    GregorianCalendar(int year, int month, int date)：在具备默认语言环境的默认时区内构造一个带有给定日期设置的 GregorianCalendar
3    GregorianCalendar(int year, int month, int date, int hour, int minute) ：为具备默认语言环境的默认时区构造一个具备给定日期和时间设置的 GregorianCalendar。
4    GregorianCalendar(int year, int month, int date, int hour, int minute, int second) ：为具备默认语言环境的默认时区构造一个具备给定日期和时间设置的 GregorianCalendar。
5    GregorianCalendar(Locale aLocale) ：在具备给定语言环境的默认时区内构造一个基于当前时间的 GregorianCalendar。
6    GregorianCalendar(TimeZone zone)：在具备默认语言环境的给定时区内构造一个基于当前时间的 GregorianCalendar。
7    GregorianCalendar(TimeZone zone, Locale aLocale)：在具备给定语言环境的给定时区内构造一个基于当前时间的 GregorianCalendar。

GregorianCalendar对象的构造方法

1    void add(int field, int amount)：根据日历规则，将指定的（有符号的）时间量添加到给定的日历字段中。
2    protected void computeFields()：转换UTC毫秒值为时间域值
3    protected void computeTime()：覆盖Calendar ，转换时间域值为UTC毫秒值
4    boolean equals(Object obj)：比较此 GregorianCalendar 与指定的 Object。
5    int get(int field)：获取指定字段的时间值
6    int getActualMaximum(int field)：返回当前日期，给定字段的最大值
7    int getActualMinimum(int field)：返回当前日期，给定字段的最小值
8    int getGreatestMinimum(int field)：返回此 GregorianCalendar 实例给定日历字段的最高的最小值。
9    Date getGregorianChange()：得到格里高利历的更改日期。
10    int getLeastMaximum(int field)：返回此 GregorianCalendar 实例给定日历字段的最低的最大值
11    int getMaximum(int field)：返回此 GregorianCalendar 实例的给定日历字段的最大值。
12    Date getTime()：获取日历当前时间。
13    long getTimeInMillis()：获取用长整型表示的日历的当前时间
14    TimeZone getTimeZone()：获取时区。
15    int getMinimum(int field)：返回给定字段的最小值。
16    int hashCode()：重写hashCode.
17    boolean isLeapYear(int year)：肯定给定的年份是否为闰年。
18    void roll(int field, boolean up)：在给定的时间字段上添加或减去（上/下）单个时间单元，不更改更大的字段。
19    void set(int field, int value)：用给定的值设置时间字段。
20    void set(int year, int month, int date)：设置年、月、日的值。
21    void set(int year, int month, int date, int hour, int minute)：设置年、月、日、小时、分钟的值。
22    void set(int year, int month, int date, int hour, int minute, int second)：设置年、月、日、小时、分钟、秒的值。
23    void setGregorianChange(Date date)：设置 GregorianCalendar 的更改日期。
24    void setTime(Date date)：用给定的日期设置Calendar的当前时间。
25    void setTimeInMillis(long millis)：用给定的long型毫秒数设置Calendar的当前时间。
26    void setTimeZone(TimeZone value)：用给定时区值设置当前时区。
27    String toString()：返回表明日历的字符串。

GregorianCalendar 类提供的一些有用的方法

import java.util.*;
  
public class GregorianCalendarDemo {
 
   public static void main(String args[]) {
      String months[] = {
      "Jan", "Feb", "Mar", "Apr",
      "May", "Jun", "Jul", "Aug",
      "Sep", "Oct", "Nov", "Dec"};
      
      int year;
      // 初始化 Gregorian 日历
      // 使用当前时间和日期
      // 默认为本地时间和时区
      GregorianCalendar gcalendar = new GregorianCalendar();
      // 显示当前时间和日期的信息
      System.out.print("Date: ");
      System.out.print(months[gcalendar.get(Calendar.MONTH)]);
      System.out.print(" " + gcalendar.get(Calendar.DATE) + " ");
      System.out.println(year = gcalendar.get(Calendar.YEAR));
      System.out.print("Time: ");
      System.out.print(gcalendar.get(Calendar.HOUR) + ":");
      System.out.print(gcalendar.get(Calendar.MINUTE) + ":");
      System.out.println(gcalendar.get(Calendar.SECOND));
      
      // 测试当前年份是否为闰年
      if(gcalendar.isLeapYear(year)) {
         System.out.println("当前年份是闰年");
      }
      else {
         System.out.println("当前年份不是闰年");
      }
   }
}

实例：判断闰年

正则表达式：正则表达式能够用来搜索、编辑或处理文本

正则表达式学习	描述
this is text	匹配字符串 "this is text"
this\s+is\s+text	注意字符串中的 \s+，能够匹配多个空格。匹配单词 "this" 后面的 \s+ 能够匹配多个空格，以后匹配 is 字符串，再以后 \s+ 匹配多个空格而后再跟上 text 字符串。能够匹配这个实例：this is text
^\d+(\.\d+)?	^ 定义了以什么开始 \d+ 匹配一个或多个数字 ? 设置括号内的选项是可选的 \. 匹配 "." 该例含义：以数字开头的数据，能够匹配的实例："5", "1.5" 和 "2.21"。

正则表达式学习

描述

this is text

匹配字符串 "this is text"

this\s+is\s+text

注意字符串中的 \s+，能够匹配多个空格。

匹配单词 "this" 后面的 \s+ 能够匹配多个空格，以后匹配 is 字符串，再以后 \s+ 匹配多个空格而后再跟上 text 字符串。

能够匹配这个实例：this is text

^\d+(\.\d+)?

^ 定义了以什么开始

\d+ 匹配一个或多个数字

? 设置括号内的选项是可选的

\. 匹配 "."

该例含义：以数字开头的数据，能够匹配的实例："5", "1.5" 和 "2.21"。

java.util.regex 包主要包括如下三个类：

Pattern 类：
pattern 对象是一个正则表达式的编译表示。Pattern 类没有公共构造方法。要建立一个 Pattern 对象，你必须首先调用其公共静态编译方法，它返回一个 Pattern 对象。该方法接受一个正则表达式做为它的第一个参数。
Matcher 类：
Matcher 对象是对输入字符串进行解释和匹配操做的引擎。与Pattern 类同样，Matcher 也没有公共构造方法。你须要调用 Pattern 对象的 matcher 方法来得到一个 Matcher 对象。

PatternSyntaxException：

PatternSyntaxException 是一个非强制异常类，它表示一个正则表达式模式中的语法错误。如下实例中使用了正则表达式 .*runoob.* 用于查找字符串中是否包了 runoob 子串：

import java.util.regex.*;
 
class RegexExample1{
   public static void main(String args[]){
      String content = "I am noob " +
        "from runoob.com.";
 
      String pattern = ".*runoob.*";
 
      boolean isMatch = Pattern.matches(pattern, content);
      System.out.println("字符串中是否包含了 'runoob' 子字符串? " + isMatch);
   }
}

/* 实例输出结果为：
字符串中是否包含了 'runoob' 子字符串?  true  */

查找字符串中是否包了 runoob 子串

捕获组

捕获组是把多个字符当一个单独单元进行处理的方法，它经过对 括号内的字符 分组来建立。

例如，正则表达式 (dog) 建立了单一分组，组里包含"d"，"o"，和"g"。

捕获组是经过从左至右计算其开括号来编号。例如，在表达式（（A）（B（C））），有四个这样的组：

((A)(B(C)))
(A)
(B(C))
(C)

能够经过调用 matcher 对象的 groupCount 方法来查看表达式有多少个分组。groupCount 方法返回一个 int 值，表示matcher对象当前有多个捕获组。

还有一个特殊的组（group(0)），它老是表明整个表达式。该组不包括在 groupCount 的返回值中。

下面的例子说明如何从一个给定的字符串中找到数字串：

import java.util.regex.Matcher;
import java.util.regex.Pattern;
 
public class RegexMatches
{
    public static void main( String args[] ){
 
      // 按指定模式在字符串查找
      String line = "This order was placed for QT3000! OK?";
      String pattern = "(\\D*)(\\d+)(.*)";
 
      // 建立 Pattern 对象
      Pattern r = Pattern.compile(pattern);
 
      // 如今建立 matcher 对象
      Matcher m = r.matcher(line);
      if (m.find( )) {
         System.out.println("Found value: " + m.group(0) );
         System.out.println("Found value: " + m.group(1) );
         System.out.println("Found value: " + m.group(2) );
         System.out.println("Found value: " + m.group(3) ); 
      } else {
         System.out.println("NO MATCH");
      }
   }
}
/** 以上实例编译运行结果以下：
Found value: This order was placed for QT3000! OK?
Found value: This order was placed for QT
Found value: 3000
Found value: ! OK?    **/

字符  说明
\
将下一字符标记为特殊字符、文本、反向引用或八进制转义符。例如，"n"匹配字符"n"。"\n"匹配换行符。序列"\\"匹配"\"，"\("匹配"("。

^
匹配输入字符串开始的位置。若是设置了 RegExp 对象的 Multiline 属性，^ 还会与"\n"或"\r"以后的位置匹配。

$
匹配输入字符串结尾的位置。若是设置了 RegExp 对象的 Multiline 属性，$ 还会与"\n"或"\r"以前的位置匹配。

*
零次或屡次匹配前面的字符或子表达式。例如，zo* 匹配"z"和"zoo"。* 等效于 {0,}。

+
一次或屡次匹配前面的字符或子表达式。例如，"zo+"与"zo"和"zoo"匹配，但与"z"不匹配。+ 等效于 {1,}。

?
零次或一次匹配前面的字符或子表达式。例如，"do(es)?"匹配"do"或"does"中的"do"。? 等效于 {0,1}。

{n}
n 是非负整数。正好匹配 n 次。例如，"o{2}"与"Bob"中的"o"不匹配，但与"food"中的两个"o"匹配。

{n,}
n 是非负整数。至少匹配 n 次。例如，"o{2,}"不匹配"Bob"中的"o"，而匹配"foooood"中的全部 o。"o{1,}"等效于"o+"。"o{0,}"等效于"o*"。

{n,m}
M 和 n 是非负整数，其中 n <= m。匹配至少 n 次，至多 m 次。例如，"o{1,3}"匹配"fooooood"中的头三个 o。'o{0,1}' 等效于 'o?'。注意：您不能将空格插入逗号和数字之间。

?
当此字符紧随任何其余限定符（*、+、?、{n}、{n,}、{n,m}）以后时，匹配模式是"非贪心的"。"非贪心的"模式匹配搜索到的、尽量短的字符串，而默认的"贪心的"模式匹配搜索到的、尽量长的字符串。例如，在字符串"oooo"中，"o+?"只匹配单个"o"，而"o+"匹配全部"o"。

.
匹配除"\r\n"以外的任何单个字符。若要匹配包括"\r\n"在内的任意字符，请使用诸如"[\s\S]"之类的模式。

(pattern)
匹配 pattern 并捕获该匹配的子表达式。可使用 $0…$9 属性从结果"匹配"集合中检索捕获的匹配。若要匹配括号字符 ( )，请使用"\("或者"\)"。

(?:pattern)
匹配 pattern 但不捕获该匹配的子表达式，即它是一个非捕获匹配，不存储供之后使用的匹配。这对于用"or"字符 (|) 组合模式部件的状况颇有用。例如，'industr(?:y|ies) 是比 'industry|industries' 更经济的表达式。

(?=pattern)
执行正向预测先行搜索的子表达式，该表达式匹配处于匹配 pattern 的字符串的起始点的字符串。它是一个非捕获匹配，即不能捕获供之后使用的匹配。例如，'Windows (?=95|98|NT|2000)' 匹配"Windows 2000"中的"Windows"，但不匹配"Windows 3.1"中的"Windows"。预测先行不占用字符，即发生匹配后，下一匹配的搜索紧随上一匹配以后，而不是在组成预测先行的字符后。

(?!pattern)
执行反向预测先行搜索的子表达式，该表达式匹配不处于匹配 pattern 的字符串的起始点的搜索字符串。它是一个非捕获匹配，即不能捕获供之后使用的匹配。例如，'Windows (?!95|98|NT|2000)' 匹配"Windows 3.1"中的 "Windows"，但不匹配"Windows 2000"中的"Windows"。预测先行不占用字符，即发生匹配后，下一匹配的搜索紧随上一匹配以后，而不是在组成预测先行的字符后。

x|y
匹配 x 或 y。例如，'z|food' 匹配"z"或"food"。'(z|f)ood' 匹配"zood"或"food"。

[xyz]
字符集。匹配包含的任一字符。例如，"[abc]"匹配"plain"中的"a"。

[^xyz]
反向字符集。匹配未包含的任何字符。例如，"[^abc]"匹配"plain"中"p"，"l"，"i"，"n"。

[a-z]
字符范围。匹配指定范围内的任何字符。例如，"[a-z]"匹配"a"到"z"范围内的任何小写字母。

[^a-z]
反向范围字符。匹配不在指定的范围内的任何字符。例如，"[^a-z]"匹配任何不在"a"到"z"范围内的任何字符。

\b
匹配一个字边界，即字与空格间的位置。例如，"er\b"匹配"never"中的"er"，但不匹配"verb"中的"er"。

\B
非字边界匹配。"er\B"匹配"verb"中的"er"，但不匹配"never"中的"er"。

\cx
匹配 x 指示的控制字符。例如，\cM 匹配 Control-M 或回车符。x 的值必须在 A-Z 或 a-z 之间。若是不是这样，则假定 c 就是"c"字符自己。

\d
数字字符匹配。等效于 [0-9]。

\D
非数字字符匹配。等效于 [^0-9]。

\f
换页符匹配。等效于 \x0c 和 \cL。

\n
换行符匹配。等效于 \x0a 和 \cJ。

\r
匹配一个回车符。等效于 \x0d 和 \cM。

\s
匹配任何空白字符，包括空格、制表符、换页符等。与 [ \f\n\r\t\v] 等效。

\S
匹配任何非空白字符。与 [^ \f\n\r\t\v] 等效。

\t
制表符匹配。与 \x09 和 \cI 等效。

\v
垂直制表符匹配。与 \x0b 和 \cK 等效。
\w
匹配任何字类字符，包括下划线。与"[A-Za-z0-9_]"等效。

\W
与任何非单词字符匹配。与"[^A-Za-z0-9_]"等效。

\xn
匹配 n，此处的 n 是一个十六进制转义码。十六进制转义码必须正好是两位数长。例如，"\x41"匹配"A"。"\x041"与"\x04"&"1"等效。容许在正则表达式中使用 ASCII 代码。

\num
匹配 num，此处的 num 是一个正整数。到捕获匹配的反向引用。例如，"(.)\1"匹配两个连续的相同字符。

\n
标识一个八进制转义码或反向引用。若是 \n 前面至少有 n 个捕获子表达式，那么 n 是反向引用。不然，若是 n 是八进制数 (0-7)，那么 n 是八进制转义码。

\nm
标识一个八进制转义码或反向引用。若是 \nm 前面至少有 nm 个捕获子表达式，那么 nm 是反向引用。若是 \nm 前面至少有 n 个捕获，则 n 是反向引用，后面跟有字符 m。若是两种前面的状况都不存在，则 \nm 匹配八进制值 nm，其中 n 和 m 是八进制数字 (0-7)。

\nml
当 n 是八进制数 (0-3)，m 和 l 是八进制数 (0-7) 时，匹配八进制转义码 nml。

\un
匹配 n，其中 n 是以四位十六进制数表示的 Unicode 字符。例如，\u00A9 匹配版权符号 (©)。

正则表达式语法

根据 Java Language Specification 的要求，Java 源代码的字符串中的反斜线被解释为 Unicode 转义或其余字符转义。所以必须在字符串字面值中使用两个反斜线，表示正则表达式受到保护，不被 Java 字节码编译器解释。例如，当解释为正则表达式时，字符串字面值 "\b" 与单个退格字符匹配，而 "\\b" 与单词边界匹配。字符串字面值 "$hello$" 是非法的，将致使编译时错误；要与字符串 (hello) 匹配，必须使用字符串字面值 "\$hello\$"。

Matcher 类的方法

索引方法提供了有用的索引值，精确代表输入字符串中在哪能找到匹配：

public int start(): 返回之前匹配的初始索引。

public int start(int group): 返回在之前的匹配操做期间，由给定组所捕获的子序列的初始索引

public int end(): 返回最后匹配字符以后的偏移量。

public int end(int group): 返回在之前的匹配操做期间，由给定组所捕获子序列的最后字符以后的偏移量。

索引方法

研究方法用来检查输入字符串并返回一个布尔值，表示是否找到该模式：

public boolean lookingAt():尝试将从区域开头开始的输入序列与该模式匹配。

public boolean find() : 尝试查找与该模式匹配的输入序列的下一个子序列。

public boolean find(int start）: 重置此匹配器，而后尝试查找匹配该模式、从指定索引开始的输入序列的下一个子序列。

public boolean matches() : 尝试将整个区域与模式匹配。

研究方法

替换方法是替换输入字符串里文本的方法：

public Matcher appendReplacement(StringBuffer sb, String replacement):实现非终端添加和替换步骤。

public StringBuffer appendTail(StringBuffer sb): 实现终端添加和替换步骤。

public String replaceAll(String replacement) : 替换模式与给定替换字符串相匹配的输入序列的每一个子序列。

public String replaceFirst(String replacement): 替换模式与给定替换字符串匹配的输入序列的第一个子序列。

public static String quoteReplacement(String s): 返回指定字符串的字面替换字符串。这个方法返回一个字符串，就像传递给Matcher类的appendReplacement 方法一个字面字符串同样工做。

替换方法

start 和 end 方法

下面是一个对单词 "cat" 出如今输入字符串中出现次数进行计数的例子：

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class TestHello {

    private static final String REGEX = "\\bcat\\b";
    private static final String INPUT =
            "cat cat cat cattie cat";

    public static void main( String args[] ){
        Pattern p = Pattern.compile(REGEX);
        Matcher m = p.matcher(INPUT); // 获取 matcher 对象
        int count = 0;

        while(m.find()) {
            count++;
            System.out.println("Match number "+count);
            System.out.println("位置： start(): "+ m.start() + "  end(): " + m.end() + "\n");
        }
    }
}
/* 运行结果：
  Match number 1
  位置： start(): 0  end(): 3

Match number 2
位置： start(): 4 end(): 7

Match number 3
位置： start(): 8 end(): 11

Match number 4
位置： start(): 19 end(): 22

其中 Start 方法返回在之前的匹配操做期间，由给定组所捕获的子序列的初始索引，end 方法最后一个匹配字符的索引加 1。 */

matches 和 lookingAt 方法

matches 和 lookingAt 方法都用来尝试匹配一个输入序列模式。它们的不一样是 matcher 要求整个序列都匹配，而lookingAt 不要求。

lookingAt 方法虽然不须要整句都匹配，可是需从第一个字符开始匹配。

这两个方法常常在输入字符串的开始使用。咱们经过下面这个例子，来解释这个功能：

import java.util.regex.Matcher;
import java.util.regex.Pattern;
 
public class RegexMatches
{
    private static final String REGEX = "foo";
    private static final String INPUT = "fooooooooooooooooo";
    private static final String INPUT2 = "ooooofoooooooooooo";
    private static Pattern pattern;
    private static Matcher matcher;
    private static Matcher matcher2;
 
    public static void main( String args[] ){
       pattern = Pattern.compile(REGEX);
       matcher = pattern.matcher(INPUT);
       matcher2 = pattern.matcher(INPUT2);
 
       System.out.println("Current REGEX is: "+REGEX);
       System.out.println("Current INPUT is: "+INPUT);
       System.out.println("Current INPUT2 is: "+INPUT2);
 
 
       System.out.println("lookingAt(): "+matcher.lookingAt());   //lookingAt(): 从第一个字符匹配，不要求整句匹配
       System.out.println("matches(): "+matcher.matches());  //matches(): 整句匹配
       System.out.println("lookingAt(): "+matcher2.lookingAt());
   }
}
/* 以上实例编译运行结果以下：
Current REGEX is: foo
Current INPUT is: fooooooooooooooooo
Current INPUT2 is: ooooofoooooooooooo
lookingAt(): true
matches(): false
lookingAt(): false   */

replaceFirst 和 replaceAll 方法

replaceFirst 和 replaceAll 方法用来替换匹配正则表达式的文本。不一样的是，replaceFirst 替换首次匹配，replaceAll 替换全部匹配。

下面的例子来解释这个功能：

import java.util.regex.Matcher;
import java.util.regex.Pattern;
 
public class RegexMatches
{
    private static String REGEX = "dog";
    private static String INPUT = "The dog says meow. " +
                                    "All dogs say meow.";
    private static String REPLACE = "cat";
 
    public static void main(String[] args) {
       Pattern p = Pattern.compile(REGEX);  
       
　　　　// get a matcher object
       Matcher m = p.matcher(INPUT);  // 找寻 字符串INPUT 中的 词段p 
       INPUT = m.replaceAll(REPLACE); // 使用 REPLACE 替换掉 词段p
       System.out.println(INPUT);
   }
}
/* 以上实例编译运行结果以下：
The cat says meow. All cats say meow.  */

appendReplacement 和 appendTail 方法

Matcher 类也提供了appendReplacement 和 appendTail 方法用于文本替换：

看下面的例子来解释这个功能：

import java.util.regex.Matcher;
import java.util.regex.Pattern;
 
public class RegexMatches {
   private static String REGEX = "a*b";
   private static String INPUT = "aabfooaabfooabfoob";
   private static String REPLACE = "-";
   public static void main(String[] args) {
      Pattern p = Pattern.compile(REGEX);

      // 获取 matcher 对象
      Matcher m = p.matcher(INPUT);
      StringBuffer sb = new StringBuffer();
      while(m.find()){
         m.appendReplacement(sb,REPLACE);
      }
      m.appendTail(sb);
      System.out.println(sb.toString());
   }
}
/* 以上实例编译运行结果以下：
   -foo-foo-foo-   */

PatternSyntaxException 类的方法

PatternSyntaxException 是一个非强制异常类，它指示一个正则表达式模式中的语法错误。

PatternSyntaxException 类提供了下面的方法来帮助咱们查看发生了什么错误。

public String getDescription(): 获取错误的描述。

public int getIndex() : 获取错误的索引。

public String getPattern(): 获取错误的正则表达式模式。

public String getMessage() : 返回多行字符串，包含语法错误及其索引的描述、错误的正则表达式模式和模式中错误索引的可视化指示。

PatternSyntaxException 类的方法

Pre-article：Java 学习（6）：java Number & Math & String & 数组...经常使用类型

Next：Java 学习（8）：java 方法

Java 学习（7）：java 日期时间 & 正则表达式

日期时间：java.util 包提供了 Date 类来封装当前的日期和时间。 Date 类提供两个构造函数来实例化 Date 对象。

Calendar类

GregorianCalendar类

正则表达式：正则表达式能够用来搜索、编辑或处理文本

捕获组

Matcher 类 的方法

start 和 end 方法

matches 和 lookingAt 方法

replaceFirst 和 replaceAll 方法

appendReplacement 和 appendTail 方法

PatternSyntaxException 类的方法

Matcher 类的方法