/** * 提取字符串内全部的img标签下的src * @param content * @return */ public static List<String> getImg(String content){ String regex; List<String> list = new ArrayList<String>(); //提取字符串中的img标签 regex = "<img[^>]+src\\s*=\\s*['\"]([^'\"]+)['\"][^>]*>"; Pattern pa = Pattern.compile(regex, Pattern.DOTALL); Matcher ma = pa.matcher(content); while (ma.find()) { //提取字符串中的src路径 Matcher m = Pattern.compile("src=\"?(.*?)(\"|>|\\s+)").matcher(ma.group()); while(m.find()) { if("http".equals(m.group(1).substring(0, 4))){//只提取http开头的图片地址 //System.out.println(m.group(1)); list.add(m.group(1)); } } } return list; }