突发灵感，看到某网站的搞笑图片挺多，作了一个小java，扫描抠了一些

时间 2019-12-07

原文原文链接

突发灵感，看到某网站的搞笑图片挺多，作了一个小java，扫描抠了一些html

这里分享一下java

/**
	 * 取得文件的后缀名
	 * @Description: TODO
	 * @param countStr
	 * @return
	 */
	private static String getFileExt(String fileStr){
		return  fileStr.substring(fileStr.lastIndexOf(".") + 1).toLowerCase();
	}

获得文件后缀，保存用网站

/**
	 * 取得不一样的页面地址
	 * @Description: TODO
	 * @param countStr
	 * @return
	 */
	private static String getPagePath(String countStr){
		String pagPath = "http://xxx.xxxx.xxxx.xxx/thread-2:count-1-1.html";
		return pagPath.replaceAll(":count", countStr);
	}

取得页面地址this

/**
	 * 取得图片的url地址
	 * @Description: TODO
	 * @param contextStr
	 * @return
	 */
	private static String getImgSrc(String contextStr){
		if(contextStr.indexOf("\" onload=\"thumbImg(this)\"")<0){
			return null;
		}
		String bigStr = contextStr.substring(contextStr.indexOf("\" onload=\"thumbImg(this)\"")-74,contextStr.indexOf("\" onload=\"thumbImg(this)\""));
		String imgStr = bigStr.substring(bigStr.indexOf("<img src=\"")+10);
		return imgStr;
	}

解析页面代码，将图片的url地址取出url

/**
     * 下载图片
     * @param f 保存的文件
     * @param imgUrl 图片地址
     */
    public static void downloadFile(File f, String imgUrl) {
            byte[] buffer = new byte[8 * 1024];
            URL u;
            URLConnection connection = null;
            try {
                    u = new URL(imgUrl);
                    connection = u.openConnection();
            } catch (Exception e) {
                    System.out.println("ERR:" + imgUrl);
                    return;
            }
            InputStream is = null;
            FileOutputStream fos = null;
            try {
                    f.createNewFile();
                    is = connection.getInputStream();
                    fos = new FileOutputStream(f);
                    int len = 0;
                    while ((len = is.read(buffer)) != -1) {
                            fos.write(buffer, 0, len);
                    }

            } catch (Exception e) {
            	e.printStackTrace();
                f.delete();
            } finally {
                    if (fos != null) {
                            try {
                                    fos.close();
                            } catch (IOException e) {
                            }
                    }
                    if (is != null) {
                            try {
                                    is.close();
                            } catch (IOException e) {
                            }
                    }
            }
            buffer = null;
            // System.gc();
    }

将url图片下载到本地
完整代码下载：http://download.csdn.net/detail/songylwq/4738238
.net