欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

JAVA中实现原生的 socket 通信机制原理

程序员文章站 2024-02-20 21:28:52
本文介绍了java中实现原生的 socket 通信机制原理,分享给大家,具体如下: 当前环境 jdk == 1.8 知识点 socket 的连接处理...

本文介绍了java中实现原生的 socket 通信机制原理,分享给大家,具体如下:

当前环境

jdk == 1.8

知识点

  • socket 的连接处理
  • io 输入、输出流的处理
  • 请求数据格式处理
  • 请求模型优化

场景

今天,和大家聊一下 java 中的 socket 通信问题。这里采用最简单的一请求一响应模型为例,假设我们现在需要向 baidu 站点进行通信。我们用 java 原生的 socket 该如何实现。

建立 socket 连接

首先,我们需要建立 socket 连接(核心代码)

import java.net.inetsocketaddress;
import java.net.socket;
import java.net.socketaddress;
    
// 初始化 socket
socket socket = new socket();
// 初始化远程连接地址
socketaddress remote = new inetsocketaddress(host, port);
// 建立连接
socket.connect(remote);

处理 socket 输入输出流

成功建立 socket 连接后,我们就能获得它的输入输出流,通信的本质是对输入输出流的处理。通过输入流,读取网络连接上传来的数据,通过输出流,将本地的数据传出给远端。

socket 连接实际与处理文件流有点类似,都是在进行 io 操作。

获取输入、输出流代码如下:

// 输入流
inputstream in = socket.getinputstream();
// 输出流
outputstream out = socket.getoutputstream();

关于 io 流的处理,我们一般会用相应的包装类来处理 io 流,如果直接处理的话,我们需要对 byte[] 进行操作,而这是相对比较繁琐的。如果采用包装类,我们可以直接以string、int等类型进行处理,简化了 io 字节操作。

下面以 bufferedreader printwriter 作为输入输出的包装类进行处理。

// 获取 socket 输入流
private bufferedreader getreader(socket socket) throws ioexception {
  inputstream in = socket.getinputstream();
  return new bufferedreader(new inputstreamreader(in));
}

// 获取 socket 输出流
private printwriter getwriter(socket socket) throws ioexception {
  outputstream out = socket.getoutputstream();
  return new printwriter(new outputstreamwriter(out));
}

数据请求与响应

有了 socket 连接、io 输入输出流,下面就该向发送请求数据,以及获取请求的响应结果。

因为有了 io 包装类的支持,我们可以直接以字符串的格式进行传输,由包装类帮我们将数据装换成相应的字节流。

因为我们与 baidu 站点进行的是 http 访问,所有我们不需要额外定义输出格式。采用标准的 http 传输格式,就能进行请求响应了(某些特定的 rpc 框架,可能会有自定义的通信格式)。

请求的数据内容处理如下:

public class httputil {

  public static string compositerequest(string host){

    return "get / http/1.1\r\n" +
        "host: " + host + "\r\n" +
        "user-agent: curl/7.43.0\r\n" +
        "accept: */*\r\n\r\n";
  }
  
}

发送请求数据代码如下:

// 发起请求
printwriter writer = getwriter(socket);
writer.write(httputil.compositerequest(host));
writer.flush();
接收响应数据代码如下:

// 读取响应
string msg;
bufferedreader reader = getreader(socket);
while ((msg = reader.readline()) != null){
  system.out.println(msg);
}

至此,讲完了原生 socket 下的创建连接、发送请求与接收响应的所有核心代码。

完整代码如下:

import java.io.*;
import java.net.inetsocketaddress;
import java.net.socket;
import java.net.socketaddress;
import com.test.network.util.httputil;

public class sockethttpclient {

  public void start(string host, int port) {

    // 初始化 socket
    socket socket = new socket();

    try {
      // 设置 socket 连接
      socketaddress remote = new inetsocketaddress(host, port);
      socket.setsotimeout(5000);
      socket.connect(remote);

      // 发起请求
      printwriter writer = getwriter(socket);
      system.out.println(httputil.compositerequest(host));
      writer.write(httputil.compositerequest(host));
      writer.flush();

      // 读取响应
      string msg;
      bufferedreader reader = getreader(socket);
      while ((msg = reader.readline()) != null){
        system.out.println(msg);
      }

    } catch (ioexception e) {
      e.printstacktrace();
    } finally {
      try {
        socket.close();
      } catch (ioexception e) {
        e.printstacktrace();
      }
    }

  }

  private bufferedreader getreader(socket socket) throws ioexception {
    inputstream in = socket.getinputstream();
    return new bufferedreader(new inputstreamreader(in));
  }

  private printwriter getwriter(socket socket) throws ioexception {
    outputstream out = socket.getoutputstream();
    return new printwriter(new outputstreamwriter(out));
  }

}

下面,我们通过实例化一个客户端,来展示 socket 通信的结果。

public class application {

  public static void main(string[] args) {

    new sockethttpclient().start("www.baidu.com", 80);

  }
}

结果输出:

JAVA中实现原生的 socket 通信机制原理 

请求模型优化

这种方式,虽然实现功能没什么问题。但是我们细看,发现在 io 写入与读取过程,是发生了 io 阻塞的情况。即:

// 会发生 io 阻塞
writer.write(httputil.compositerequest(host));
reader.readline();

所以如果要同时请求10个不同的站点,如下:

public class singlethreadapplication {

  public static void main(string[] args) {

    // httpconstant.hosts 为 站点集合
    for (string host: httpconstant.hosts) {

      new sockethttpclient().start(host, httpconstant.port);

    }

  }
}

它一定是第一个请求响应结束后,才会发起下一个站点处理。

这在服务端更明显,虽然这里的代码是客户端连接,但是具体的操作和服务端是差不多的。请求只能一个个串行处理,这在响应时间上肯定不能达标。

  • 多线程处理

有人觉得这根本不是问题,java 是多线程的编程语言。对于这种情况,采用多线程的模型再合适不过。

public class multithreadapplication {

  public static void main(string[] args) {

    for (final string host: httpconstant.hosts) {

      thread t = new thread(new runnable() {
        public void run() {
          new sockethttpclient().start(host, httpconstant.port);
        }
      });

      t.start();

    }
  }
}

这种方式起初看起来挺有用的,但并发量一大,应用会起很多的线程。都知道,在服务器上,每一个线程实际都会占据一个文件句柄。而服务器上的句柄数是有限的,而且大量的线程,造成的线程间切换的消耗也会相当的大。所以这种方式在并发量大的场景下,一定是承载不住的。

  • 多线程 + 线程池 处理

既然线程太多不行,那我们控制一下线程创建的数目不就行了。只启动固定的线程数来进行 socket 处理,既利用了多线程的处理,又控制了系统的资源消耗。

public class threadpoolapplication {

  public static void main(string[] args) {

    executorservice executorservice = executors.newfixedthreadpool(8);

    for (final string host: httpconstant.hosts) {

      thread t = new thread(new runnable() {
        public void run() {
          new sockethttpclient().start(host, httpconstant.port);
        }
      });

      executorservice.submit(t);
      new sockethttpclient().start(host, httpconstant.port);

    }

  }
}

关于启动的线程数,一般 cpu 密集型会设置在 n+1(n为cpu核数),io 密集型设置在 2n + 1。

这种方式,看起来是最优的了。那有没有更好的呢,如果一个线程能同时处理多个 socket 连接,并且在每个 socket 输入输出数据没有准备好的情况下,不进行阻塞,那是不是更优呢。这种技术叫做“io多路复用”。在 java 的 nio 包中,提供了相应的实现。

后续

  • java 中是如何实现 io多路复用
  • netty 下的实现异步请求的

github地址:https://github.com/jasongeng88/blog/tree/master/201708

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。