摘要:本文属于原创,欢迎转载,转载请保留出处:https://github.com/jasonGeng88/blogjava
今天,和你们聊一下 JAVA 中的 socket 通讯问题。这里采用最简单的一请求一响应模型为例,假设咱们如今须要向 baidu 站点进行通讯。咱们用 JAVA 原生的 socket 该如何实现。git
首先,咱们须要创建 socket 链接(核心代码)github
import java.net.InetSocketAddress; import java.net.Socket; import java.net.SocketAddress; // 初始化 socket Socket socket = new Socket(); // 初始化远程链接地址 SocketAddress remote = new InetSocketAddress(host, port); // 创建链接 socket.connect(remote);
成功创建 socket 链接后,咱们就能得到它的输入输出流,通讯的本质是对输入输出流的处理。经过输入流,读取网络链接上传来的数据,经过输出流,将本地的数据传出给远端。编程
socket 链接实际与处理文件流有点相似,都是在进行 IO 操做。服务器
获取输入、输出流代码以下:网络
// 输入流 InputStream in = socket.getInputStream(); // 输出流 OutputStream out = socket.getOutputStream();
关于 IO 流的处理,咱们通常会用相应的包装类来处理 IO 流,若是直接处理的话,咱们须要对 byte[]
进行操做,而这是相对比较繁琐的。若是采用包装类,咱们能够直接以string
、int
等类型进行处理,简化了 IO 字节操做。多线程
下面以 BufferedReader
与 PrintWriter
做为输入输出的包装类进行处理。并发
// 获取 socket 输入流 private BufferedReader getReader(Socket socket) throws IOException { InputStream in = socket.getInputStream(); return new BufferedReader(new InputStreamReader(in)); } // 获取 socket 输出流 private PrintWriter getWriter(Socket socket) throws IOException { OutputStream out = socket.getOutputStream(); return new PrintWriter(new OutputStreamWriter(out)); }
有了 socket 链接、IO 输入输出流,下面就该向发送请求数据,以及获取请求的响应结果。框架
由于有了 IO 包装类的支持,咱们能够直接以字符串的格式进行传输,由包装类帮咱们将数据装换成相应的字节流。curl
由于咱们与 baidu 站点进行的是 HTTP 访问,全部咱们不须要额外定义输出格式。采用标准的 HTTP 传输格式,就能进行请求响应了(某些特定的 RPC 框架,可能会有自定义的通讯格式)。
请求的数据内容处理以下:
public class HttpUtil { public static String compositeRequest(String host){ return "GET / HTTP/1.1\r\n" + "Host: " + host + "\r\n" + "User-Agent: curl/7.43.0\r\n" + "Accept: */*\r\n\r\n"; } }
发送请求数据代码以下:
// 发起请求 PrintWriter writer = getWriter(socket); writer.write(HttpUtil.compositeRequest(host)); writer.flush();
接收响应数据代码以下:
// 读取响应 String msg; BufferedReader reader = getReader(socket); while ((msg = reader.readLine()) != null){ System.out.println(msg); }
至此,讲完了原生 socket 下的建立链接、发送请求与接收响应的全部核心代码。
完整代码以下:
import java.io.*; import java.net.InetSocketAddress; import java.net.Socket; import java.net.SocketAddress; import com.test.network.util.HttpUtil; public class SocketHttpClient { public void start(String host, int port) { // 初始化 socket Socket socket = new Socket(); try { // 设置 socket 链接 SocketAddress remote = new InetSocketAddress(host, port); socket.setSoTimeout(5000); socket.connect(remote); // 发起请求 PrintWriter writer = getWriter(socket); System.out.println(HttpUtil.compositeRequest(host)); writer.write(HttpUtil.compositeRequest(host)); writer.flush(); // 读取响应 String msg; BufferedReader reader = getReader(socket); while ((msg = reader.readLine()) != null){ System.out.println(msg); } } catch (IOException e) { e.printStackTrace(); } finally { try { socket.close(); } catch (IOException e) { e.printStackTrace(); } } } private BufferedReader getReader(Socket socket) throws IOException { InputStream in = socket.getInputStream(); return new BufferedReader(new InputStreamReader(in)); } private PrintWriter getWriter(Socket socket) throws IOException { OutputStream out = socket.getOutputStream(); return new PrintWriter(new OutputStreamWriter(out)); } }
下面,咱们经过实例化一个客户端,来展现 socket 通讯的结果。
public class Application { public static void main(String[] args) { new SocketHttpClient().start("www.baidu.com", 80); } }
结果输出:
这种方式,虽然实现功能没什么问题。可是咱们细看,发如今 IO 写入与读取过程,是发生了 IO 阻塞的状况。即:
// 会发生 IO 阻塞 writer.write(HttpUtil.compositeRequest(host)); reader.readLine();
因此若是要同时请求10个不一样的站点,以下:
public class SingleThreadApplication { public static void main(String[] args) { // HttpConstant.HOSTS 为 站点集合 for (String host: HttpConstant.HOSTS) { new SocketHttpClient().start(host, HttpConstant.PORT); } } }
它必定是第一个请求响应结束后,才会发起下一个站点处理。
这在服务端更明显,虽然这里的代码是客户端链接,可是具体的操做和服务端是差很少的。请求只能一个个串行处理,这在响应时间上确定不能达标。
有人以为这根本不是问题,JAVA 是多线程的编程语言。对于这种状况,采用多线程的模型再合适不过。
public class MultiThreadApplication { public static void main(String[] args) { for (final String host: HttpConstant.HOSTS) { Thread t = new Thread(new Runnable() { public void run() { new SocketHttpClient().start(host, HttpConstant.PORT); } }); t.start(); } } }
这种方式起初看起来挺有用的,但并发量一大,应用会起不少的线程。都知道,在服务器上,每个线程实际都会占据一个文件句柄。而服务器上的句柄数是有限的,并且大量的线程,形成的线程间切换的消耗也会至关的大。因此这种方式在并发量大的场景下,必定是承载不住的。
既然线程太多不行,那咱们控制一下线程建立的数目不就好了。只启动固定的线程数来进行 socket 处理,既利用了多线程的处理,又控制了系统的资源消耗。
public class ThreadPoolApplication { public static void main(String[] args) { ExecutorService executorService = Executors.newFixedThreadPool(8); for (final String host: HttpConstant.HOSTS) { Thread t = new Thread(new Runnable() { public void run() { new SocketHttpClient().start(host, HttpConstant.PORT); } }); executorService.submit(t); new SocketHttpClient().start(host, HttpConstant.PORT); } } }
关于启动的线程数,通常 CPU 密集型会设置在 N+1(N为CPU核数),IO 密集型设置在 2N + 1。
这种方式,看起来是最优的了。那有没有更好的呢,若是一个线程能同时处理多个 socket 链接,而且在每一个 socket 输入输出数据没有准备好的状况下,不进行阻塞,那是否是更优呢。这种技术叫作“IO多路复用”。在 JAVA 的 nio 包中,提供了相应的实现。