欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

大白话带你梳理一下Dubbo的那些事儿

程序员文章站 2022-03-18 14:01:47
首先声明,本文并不是什么代码实战类型的文章,适合于想对dubbo有更加全面认识的读者阅读,文章不会过于深奥,只是将一系列的知识点串通起来,帮助读者温故而知新。 RPC服务的介绍 相信有过一些分布式开发经历的读者都有用过一些RPC框架,通过框架包装好之后提供的API接口调用远程服务,体验感觉起来就和调 ......

首先声明,本文并不是什么代码实战类型的文章,适合于想对dubbo有更加全面认识的读者阅读,文章不会过于深奥,只是将一系列的知识点串通起来,帮助读者温故而知新。

rpc服务的介绍

相信有过一些分布式开发经历的读者都有用过一些rpc框架,通过框架包装好之后提供的api接口调用远程服务,体验感觉起来就和调用本地服务一样轻松。这么方便好用的技术框架,在实际的开发过程中是如何包装的呢?

很早的时候,国外的工程师设计了一种能够通过a计算机调用b计算机上边应用程序的技术,这种技术不需要开发人员对于网络通讯了解过多,并且调用其他机器上边程序的时候和调用本地的程序一样方便好用。

a机器发起请求去调用b机器程序的时候会被挂起,b机器接收到a机器发起的请求参数之后会做一定的参数转换,最后将对应的程序结果返回给a,这就是最原始的rpc服务调用了。

rpc调用的优势

简单

不需要开发者对于网络通信做过多的设置,例如我们在使用http协议进行远程接口调用的时候,总是会需要编写较多的http协议参数(header,context,accept-language,accept-encode等等),这些处理对于开发人员来说,实际上都并不是特别友好。但是rpc服务调用框架通常都将这类解析进行了对应的封装,大大降低了开发人员的使用难度。

高效

在网络传输方面,rpc更多是处于应用层和传输层之间。这里我们需要先理清楚一个问题,网络分层。rpc是处于会话层的部分,相比处于应用层的http而言,rpc要比rest服务调用更加轻便。

常见的远程调用技术

rmi

利用java.rmi包实现,基于java远程方法协议(java remote method protocol) 和java的原生序列化

hessian

是一个轻量级的remoting onhttp工具,使用简单的方法提供了rmi的功能。基于http协议,采用二进制编解码。

protobuf-rpc-pro

是一个java类库,提供了基于 google 的 protocol buffers 协议的远程方法调用的框架。基于 netty 底层的 nio 技术。支持 tcp 重用/ keep-alive、ssl加密、rpc 调用取消操作、嵌入式日志等功能。

thrift

是一种可伸缩的跨语言服务的软件框架。它拥有功能强大的代码生成引擎,无缝地支持c + +,c#,java,python和php和ruby。thrift允许你定义一个描述文件,描述数据类型和服务接口。依据该文件,编译器方便地生成rpc客户端和服务器通信代码。

最初由facebook开发用做系统内部语言之间的rpc通信,2007年由facebook贡献到apache基金 ,现在是apache下的opensource之一 。支持多种语言之间的rpc方式的通信:php语言client可以构造一个对象,调用相应的服务方法来调用java语言的服务,跨越语言的c/s rpc调用。底层通讯基于socket。

avro

出自hadoop之父doug cutting, 在thrift已经相当流行的情况下推出avro的目标不仅是提供一套类似thrift的通讯中间件,更是要建立一个新的,标准性的云计算的数据交换和存储的protocol。支持http,tcp两种协议。

dubbo

dubbo是 阿里巴巴公司开源的一个高性能优秀的服务框架,使得应用可通过高性能的 rpc 实现服务的输出和输入功能,可以和 spring框架无缝集成。

上边我们说到了rpc的远程调用发展历史,那么下边我们一起来深入探讨一下rpc的服务。

首先我们来看看osi的网络协议内容。

osi的七层网络模型

对于osi的七层网络模型我绘制了下边的这么一张图:

大白话带你梳理一下Dubbo的那些事儿

下边是我个人对于这七层协议的理解:

  • 应用层 主要是对于服务接口的格式多定义,例如提供一定的终端接口暴露给外部应用调用。

  • 表示层 处理一些数据传输的格式转换,例如说编码的统一,加密和解密处理。

  • 会话层 管理用户的会话和对话,建立不同机器之间的会话连接。

  • 传输层 向网络层提供可靠有序的数据包信息。

  • 网络层 真正发送数据包信息的层面,提供流和拥塞控制,从而降低网络的资源损耗。

  • 数据链路层 封装对应的数据包,检测和纠正数据包传输信息。

  • 物理层 通过网络通讯设备发送数据

http & rpc

http主要是位于tcp/ip协议栈的应用层部分,首先需要构建三次握手的链接,接着才能进行数据信息的请求发送,最后进行四次挥手断开链接。

rpc在请求的过程中跨越了传输层和应用层,这是因为它本身是依赖于socket的原因。(再深入的原因我也不知道)。减少了上边几层的封装,rpc的请求效率自然是要比http高效很多。

那么一个完整的rpc调用应该包含哪些部分呢?

通常我们将一个完整的rpc架构分为了以下几个核心组件:

  • server

  • client

  • server stub

  • client stub

这四个模块中我稍微说下stub吧。这个单词翻译过来称之为存根。

client stub 就是将客户端请求的参数,服务名称,服务地址进行打包,统一发送给server方。

server stub 我用通俗易懂的语言来解释就是服务端接收到client发送的数据之后进行消息解包,调用本地方法。(看过netty拆包机制应该会对这块比较了解)。

dubbo的核心属性

其实dubbo配置里面的核心内容就是 服务暴露,服务发现,服务治理

什么是服务暴露,服务发现,服务治理?

下边我们用一段xml的配置来进行讲解:

<?xml version="1.0" encoding="utf-8"?>
<beans xmlns:xsi="http://www.w3.org/2001/xmlschema-instance"
       xmlns:dubbo="http://code.alibabatech.com/schema/dubbo"
       xmlns="http://www.springframework.org/schema/beans"
       xsi:schemalocation="http://www.springframework.org/schema/beans http://www.springframework.org/schema/beans/spring-beans-2.5.xsd
    http://code.alibabatech.com/schema/dubbo http://code.alibabatech.com/schema/dubbo/dubbo.xsd">
    <dubbo:application name="dubbo-invoker-provider">
        <dubbo:parameter key="qos.port" value="22222"/>
    </dubbo:application>
    <dubbo:registry address="zookeeper://127.0.0.1:2181"/>
    <dubbo:protocol name="dubbo" port="20880"/>
    <bean id="userservice" class="com.sise.user.service.userserviceimpl" />
    <dubbo:service interface="com.sise.user.service.userservice" ref="userservice" />
</beans>

 

在dubbo的配置文件里面,通常我们所说的dubbo:service 可以理解为服务暴露,dubbo:refernce 为服务发现,mock是服务治理,timeout属于服务治理的一种(性能调优).

假设dubbo里面希望将一些公共的配置抽取出来,我们可以通过properties文件进行配置,dubbo在加载配置文件的优先顺序如下:

  1. 优先会读取jvm -d启动参数后边的内容

  2. 读取xml配置文件

  3. 读取properties配置文件内容

dubbo默认会读取dubbo.properties配置文件的信息,例如下边这种配置:

dubbo.application.name=dubbo-user-service
dubbo.registry.address=zookeeper://127.0.0.1:2181

 

假设我们的dubbo配置文件不命名为dubbo.properties(假设命名为了my-dubbo.properties)的时候,可以在启动参数的后边加上这么一段指令:

 -ddubbo.properties.file=my-dubbo.properties

 

那么在应用程序启动之后,对应的工程就会读取指定的配置文件,这样就可以将一些共用的dubbo配置给抽取了出来。

xml和配置类的映射

在工作中,我们通常都会通过配置xml的方式来设定一个服务端暴露的服务接口和消费端需要调用的服务信息,这些配置的xml实际上在dubbo的源码中都会被解析为对应的实体类对象。

例如说我们常用到的reference配置类,下边我贴出一段代码:

package com.sise.user.config;
import com.sise.user.service.userservice;
import com.sise.user.service.userserviceimpl;
import org.apache.dubbo.config.*;
import java.io.ioexception;
import java.util.concurrent.countdownlatch;
/**
 * dubbo里面的自定义配置类
 *
 * @author idea
 * @data 2019/12/29
 */
public class dubboselfdefconfig {
    /**
     * dubbo的服务暴露
     */
    public void server() {
        applicationconfig applicationconfig = new applicationconfig();
        applicationconfig.setname("dubbo-server-config");
        registryconfig registryconfig = new registryconfig();
        registryconfig.setaddress("zookeeper://127.0.0.1:2181");
        protocolconfig protocolconfig = new protocolconfig();
        protocolconfig.setname("dubbo");
        protocolconfig.setport(20880);
        protocolconfig.setthreads(200);
        userservice userservice = new userserviceimpl();
        serviceconfig<userservice> serviceconfig = new serviceconfig<>();
        serviceconfig.setapplication(applicationconfig);
        serviceconfig.setregistry(registryconfig);
        serviceconfig.setprotocol(protocolconfig);
        serviceconfig.setinterface(userservice.class);
        serviceconfig.setref(userservice);
        serviceconfig.export();
    }

    public void consumer() {
        applicationconfig applicationconfig = new applicationconfig();
        applicationconfig.setname("dubbo-client-config");
        registryconfig registryconfig = new registryconfig();
        registryconfig.setaddress("zookeeper://127.0.0.1:2181");
        referenceconfig<userservice> referenceconfig = new referenceconfig<>();
        referenceconfig.setapplication(applicationconfig);
        referenceconfig.setregistry(registryconfig);
        referenceconfig.setinterface(userservice.class);
        userservice localref = referenceconfig.get();
        localref.echo("idea");
    }
    public static void main(string[] args) throws interruptedexception, ioexception {
        dubboselfdefconfig d = new dubboselfdefconfig();
        d.consumer();
        countdownlatch countdownlatch = new countdownlatch(1);
        countdownlatch.await();
    }
}

 

在这段代码里面,通过案例可以发现有这些信息内容:

    userservice localref = referenceconfig.get();
    localref.echo("idea");

 

这两行语句是获取具体服务的核心之处,由于我在别处定义了一个叫做userservice 的公共服务接口,因此在服务引用的过程中可以进行转换。

dubbo2.7的三大新特新

dubbo的github官方地址为 https://github.com/apache/dubbo

大白话带你梳理一下Dubbo的那些事儿在这里插入图片描述


dubbo 目前有如图所示的 5 个分支,其中 2.7.1-release 只是一个临时分支,忽略不计,对其他 4 个分支而言,我归纳了一下,分别有如下信息:

 

  • 2.5.x 近期已经通过投票,dubbo 社区即将停止对其的维护。

  • 2.6.x 为长期支持的版本,也是 dubbo 贡献给 apache 之前的版本,其包名前缀为:com.alibaba,jdk 版本对应 1.6。

  • 3.x-dev 是前瞻性的版本,对 dubbo 进行一些高级特性的补充,如支持 rx 特性。

  • master 为长期支持的版本,版本号为 2.7.x,也是 dubbo 贡献给 apache 的开发版本,其包名前缀为:org.apache,jdk 版本对应 1.8。

dubbo 2.7 新特性

dubbo 2.7.x 作为 apache 的孵化版本,除了代码优化之外,还新增了许多重磅的新特性,本文将会介绍其中最典型的2个新特性:

  • 异步化改造

  • 三大中心改造

异步化改造

1.异步化调用的方式,在dubbo2.7版本里面提供了异步化调用的功能,相关案例代码如下所示:

@restcontroller
@requestmapping(value = "/test")
public class testcontroller {
    @reference(async = true)
    private userservice userservice;

    @getmapping("/teststr")
    public string teststr(string param){
        return userservice.testecho(param);
    }
}

 

但是通过这种异步发送的方式我们通常都是获取不到响应值的,所以这里的return为null。

如果在低于2.7版本的dubbo框架中希望获取到异步返回的响应值还是需要通过rpc上下文来提取信息。

代码案例如下所示:

 @getmapping("/futureget")
    public string futureget(string param) throws executionexception, interruptedexception {
        userservice.testecho(param);
        future<string> future= rpccontext.getcontext().getfuture();
        string result = future.get();
        system.out.println("this is :"+result);
        return result;
    }

 

通过rpc上下文的方式可以取到对应的响应值,但是这种方式需要有所等待,因此此时的效率会有所降低。假设我们将dubbo的版本提升到了2.7.1之后,通过使用completablefuture来进行接口优化的话,这部分的代码实现就会有所变化:

/**
 * @author idea
 * @date 2019/12/31
 * @version v1.0
 */
public interface demoservice {
      string sayhello(string name) ;
      default completablefuture<string> sayasynchello(string name){
            return completablefuture.completedfuture(sayhello(name));
      }
}

 

调用方代码:

package com.sise.consumer.controller;

import com.sise.dubbo.service.demoservice;
import org.apache.dubbo.config.annotation.reference;
import org.springframework.web.bind.annotation.requestmapping;
import org.springframework.web.bind.annotation.restcontroller;
import java.util.concurrent.completablefuture;
import java.util.concurrent.atomic.atomicreference;
/**
 * @author idea
 * @date 2019/12/31
 * @version v1.0
 */
@restcontroller
@requestmapping(value = "/demo")
public class democontroller {

    @reference
    private demoservice demoservice;

    @requestmapping(value = "/testdemo")
    public string testdemo(string name){
        system.out.println("【testdemo】 this is :"+name);
        return demoservice.sayhello(name);
    }.

    @requestmapping(value = "/testasyncdemo")
    public string testasyncdemo(string name){
        system.out.println("【testasyncdemo】 this is :"+name);
        completablefuture<string> future = demoservice.sayasynchello(name);
        atomicreference<string> result = null;
        //通过一条callback线程来处理响应的数据信息
        future.whencomplete((retvalue,exception)->{
           if(exception==null){
               system.out.println(retvalue);
               result.set(retvalue);
           } else {
               exception.printstacktrace();
           }
        });
        return "通过一条callback线程来处理响应的数据信息,所以这个时候获取不到信息响应";
    }
}

 

这样的调用是借助了callback线程来帮我们处理原先的数据内容,关于dubbo里面的异步化调用,我借用了官方的一张图来进行展示:

大白话带你梳理一下Dubbo的那些事儿


我们上边讲解的众多方法都只是针对于dubbo的客户端异步化,并没有讲解关于服务端的异步化处理,这是因为结合dubbo的业务线程池模型来思考,服务端的异步化处理比较鸡肋(因为dubbo内部服务端的线程池本身就是异步化调用的了)。

当然dubbo 2.6 里面对于接口异步化调用的配置到了2.7版本依旧有效。

三大中心的改造

注册中心

在dubbo2.7之前,dubbo主要还是由consumer,provider ,register组成,然而在2.7版本之后,dubbo的注册中心被拆解为了三个中心,分别是原先的注册中心元数据中心以及配置中心

元数据配置

在dubbo2.7版本中,将原先注册在zk上边的过多数据进行了注册拆分,这样能够保证减少对于zk端的压力。具体配置如下:

<dubbo:registry address=“zookeeper://127.0.0.1:2181” simplified="true"/>

 

简化了相应配置之后,dubbo也只会上传一些必要的服务治理数据了,简化版本的服务数据只剩下下边这些信息:

dubbo://30.5.120.185:20880/com.sise.testservice?
application=test-provider&
dubbo=2.0.2&
release=2.7.0&
timestamp=1554982201973

 

对于其他的元数据信息将会被存储到一些元数据中心里面,例如说redis,nacos,zk等

元数据配置改造主要解决的问题是:推送量大 -> 存储数据量大 -> 网络传输量大 -> 延迟严重

配置中心

dubbo2.7开始支持多种分布式配置中心的组件。例如说:zk,spring cloud config, apollo, nacos,关于这部分的配置网上的资料也比较多,我就不在这里细说了。