SpringCloud学习笔记(四)- SpringCloud Hystrix
Hystrix 服务容错保护
SpringCloud 在远程服务调用时, 可能因为网络原因或是依赖自身服务问题出现调用故障或延迟,这些故障直接导致调用方对外服务也出现延迟,若此时调用方服务不断增加,这样就会因为等待或延迟出现人员积压,最终导致服务崩溃。
针对上述问题, SpringCloud Hystrix 实现了断路器、线程隔离等一系列服务保护功能,从而对延迟和故障提供了强大的容错能力。
Hystrix 具备了服务降级、服务熔断、线程和信号隔离、请求缓存、请求合并以及服务监控等强大功能。
依赖包
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-hystrix</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-actuator</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-hystrix-dashboard</artifactId>
</dependency>
Camden.SR6
1、 在ribbon 基础上配置简单hystrix
1、 在启动类中添加
@SpringBootApplication
@EnableDiscoveryClient
@EnableCircuitBreaker
public class Hystrix01Application {
@Bean
@LoadBalanced
public RestTemplate restTemplate(){
return new RestTemplate();
}
public static void main(String[] args) {
SpringApplication.run(Hystrix01Application.class, args);
}
}
2、 controller 层中
@RestController
public class ShowController {
@Autowired
RestTemplate restTemplate;
@RequestMapping("/show/{id}")
@HystrixCommand(fallbackMethod = "showForErr")
public Object show(@PathVariable String id){
Object obj = restTemplate.getForEntity("http://EUREKA-CLIENT/show/"+id,Object.class);
return obj;
}
public Object showForErr(String id){
return "出错了:"+id;
}
3、 通过以下配置,使用与此方法同一线程调用
@HystrixCommand(fallbackMethod = "showForErr",
commandProperties = {
@HystrixProperty(name="execution.isolation.strategy", value="SEMAPHORE")
}
)
注意:在feign 中使用hystrix 要在yml 文件中添加 feign.hystrix.enabled=true
# 详细参数介绍
@RestController
public class MovieController {
@Autowired
private RestTemplate restTemplate;
@GetMapping("/movie/{id}")
@HystrixCommand(commandProperties = {
@HystrixProperty(name = "execution.isolation.thread.timeoutInMilliseconds", value = "1000"),
@HystrixProperty(name = "execution.timeout.enabled", value = "false")},fallbackMethod = "findByIdFallback")
public User findById(@PathVariable Long id) {
return this.restTemplate.getForObject("http://microservice-provider-user/simple/" + id, User.class);
}
hystrix.command.default和hystrix.threadpool.default中的default为默认CommandKey
Command Properties
Execution相关的属性的配置:
hystrix.command.default.execution.isolation.strategy 隔离策略,默认是Thread, 可选Thread|Semaphore
hystrix.command.default.execution.isolation.thread.timeoutInMilliseconds 命令执行超时时间,默认1000ms
hystrix.command.default.execution.timeout.enabled 执行是否启用超时,默认启用true
hystrix.command.default.execution.isolation.thread.interruptOnTimeout 发生超时是是否中断,默认true
hystrix.command.default.execution.isolation.semaphore.maxConcurrentRequests 最大并发请求数,默认10,该参数当使用ExecutionIsolationStrategy.SEMAPHORE策略时才有效。如果达到最大并发请求数,请求会被拒绝。理论上选择semaphore size的原则和选择thread size一致,但选用semaphore时每次执行的单元要比较小且执行速度快(ms级别),否则的话应该用thread。
semaphore应该占整个容器(tomcat)的线程池的一小部分。
Fallback相关的属性
这些参数可以应用于Hystrix的THREAD和SEMAPHORE策略
hystrix.command.default.fallback.isolation.semaphore.maxConcurrentRequests 如果并发数达到该设置值,请求会被拒绝和抛出异常并且fallback不会被调用。默认10
hystrix.command.default.fallback.enabled 当执行失败或者请求被拒绝,是否会尝试调用hystrixCommand.getFallback() 。默认true
Circuit Breaker相关的属性
hystrix.command.default.circuitBreaker.enabled 用来跟踪circuit的健康性,如果未达标则让request短路。默认true
hystrix.command.default.circuitBreaker.requestVolumeThreshold 一个rolling window内最小的请求数。如果设为20,那么当一个rolling window的时间内(比如说1个rolling window是10秒)收到19个请求,即使19个请求都失败,也不会触发circuit break。默认20
hystrix.command.default.circuitBreaker.sleepWindowInMilliseconds 触发短路的时间值,当该值设为5000时,则当触发circuit break后的5000毫秒内都会拒绝request,也就是5000毫秒后才会关闭circuit。默认5000
hystrix.command.default.circuitBreaker.errorThresholdPercentage错误比率阀值,如果错误率>=该值,circuit会被打开,并短路所有请求触发fallback。默认50
hystrix.command.default.circuitBreaker.forceOpen 强制打开熔断器,如果打开这个开关,那么拒绝所有request,默认false
hystrix.command.default.circuitBreaker.forceClosed 强制关闭熔断器 如果这个开关打开,circuit将一直关闭且忽略circuitBreaker.errorThresholdPercentage
Metrics相关参数
hystrix.command.default.metrics.rollingStats.timeInMilliseconds 设置统计的时间窗口值的,毫秒值,circuit break 的打开会根据1个rolling window的统计来计算。若rolling window被设为10000毫秒,则rolling window会被分成n个buckets,每个bucket包含success,failure,timeout,rejection的次数的统计信息。默认10000
hystrix.command.default.metrics.rollingStats.numBuckets 设置一个rolling window被划分的数量,若numBuckets=10,rolling window=10000,那么一个bucket的时间即1秒。必须符合rolling window % numberBuckets == 0。默认10
hystrix.command.default.metrics.rollingPercentile.enabled 执行时是否enable指标的计算和跟踪,默认true
hystrix.command.default.metrics.rollingPercentile.timeInMilliseconds 设置rolling percentile window的时间,默认60000
hystrix.command.default.metrics.rollingPercentile.numBuckets 设置rolling percentile window的numberBuckets。逻辑同上。默认6
hystrix.command.default.metrics.rollingPercentile.bucketSize 如果bucket size=100,window=10s,若这10s里有500次执行,只有最后100次执行会被统计到bucket里去。增加该值会增加内存开销以及排序的开销。默认100
hystrix.command.default.metrics.healthSnapshot.intervalInMilliseconds 记录health 快照(用来统计成功和错误绿)的间隔,默认500ms
Request Context 相关参数
hystrix.command.default.requestCache.enabled 默认true,需要重载getCacheKey(),返回null时不缓存
hystrix.command.default.requestLog.enabled 记录日志到HystrixRequestLog,默认true
Collapser Properties 相关参数
hystrix.collapser.default.maxRequestsInBatch 单次批处理的最大请求数,达到该数量触发批处理,默认Integer.MAX_VALUE
hystrix.collapser.default.timerDelayInMilliseconds 触发批处理的延迟,也可以为创建批处理的时间+该值,默认10
hystrix.collapser.default.requestCache.enabled 是否对HystrixCollapser.execute() and HystrixCollapser.queue()的cache,默认true
ThreadPool 相关参数
线程数默认值10适用于大部分情况(有时可以设置得更小),如果需要设置得更大,那有个基本得公式可以follow:
requests per second at peak when healthy × 99th percentile latency in seconds + some breathing room
每秒最大支撑的请求数 (99%平均响应时间 + 缓存值)
比如:每秒能处理1000个请求,99%的请求响应时间是60ms,那么公式是:
(0.060+0.012)
基本得原则时保持线程池尽可能小,他主要是为了释放压力,防止资源被阻塞。
当一切都是正常的时候,线程池一般仅会有1到2个线程**来提供服务
hystrix.threadpool.default.coreSize 并发执行的最大线程数,默认10
hystrix.threadpool.default.maxQueueSize BlockingQueue的最大队列数,当设为-1,会使用SynchronousQueue,值为正时使用LinkedBlcokingQueue。该设置只会在初始化时有效,之后不能修改threadpool的queue size,除非reinitialising thread executor。默认-1。
hystrix.threadpool.default.queueSizeRejectionThreshold 即使maxQueueSize没有达到,达到queueSizeRejectionThreshold该值后,请求也会被拒绝。因为maxQueueSize不能被动态修改,这个参数将允许我们动态设置该值。if maxQueueSize == -1,该字段将不起作用
hystrix.threadpool.default.keepAliveTimeMinutes 如果corePoolSize和maxPoolSize设成一样(默认实现)该设置无效。如果通过plugin(https://github.com/Netflix/Hystrix/wiki/Plugins)使用自定义实现,该设置才有用,默认1.
hystrix.threadpool.default.metrics.rollingStats.timeInMilliseconds 线程池统计指标的时间,默认10000
hystrix.threadpool.default.metrics.rollingStats.numBuckets 将rolling window划分为n个buckets,默认10
2、 Hystrix HystrixDashboard
ystrix的主要优点之一是它收集关于每个HystrixCommand的一套指标。Hystrix仪表板以有效的方式显示每个断路器的运行状况。他的配置只需要在主类中加上 @EnableHystrixDashboard 注解
1、例如:
@SpringBootApplication
@EnableDiscoveryClient
@EnableCircuitBreaker
@EnableHystrixDashboard
public class Hystrix01Application {
@Bean
@LoadBalanced
public RestTemplate restTemplate(){
return new RestTemplate();
}
public static void main(String[] args) {
SpringApplication.run(Hystrix01Application.class, args);
}
}
2、通过地址 http://localhost:8088/hystrix 进入还有Hystrix dashboard 搜索界面
3、 在搜索款内输入http://localhost:8088/hystrix.stream,跳转到监控图形界面
Finchley 版本需要一下配置yml
management:
endpoints:
web:
exposure:
include: hystrix.stream
默认的stream地址为:http://IP:PORT/actuator/hystrix.stream
hystrix 参数配置
// 设置超时时间
hystrix.command.default.execution.isolation.thread.timeoutInMilliseconds: 6000
Turbine 集群监控
在分布式系统中,往往有很多实例需要维护和监控,上述只介绍了对单实例的监控, 这里我们利用turbine 和 hystrix dashboard 配合对集群进行监控
1、 pom 引用:
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-turbine</artifactId>
</dependency>
2、配置yml 配置文件
spring:
application:
name: turbine
server:
port: 9093
eureka:
client:
service-url:
defaultZone: http://localhost:8081/eureka/
turbine:
aggregator:
clusterConfig: HYSTRIX
appConfig: hystrix
clusterNameExpression: "'default'"
turbine.instanceUrlSuffix.HYSTRIX: /panlei/hystrix.stream
logging:
level:
root : INFO
com.netflix.turbine.monitor: INFO
turbine.aggregator.clusterConfig 指定聚合哪些集群,多个使用","分割,默认为default。可使用http://…/turbine.stream?cluster={clusterConfig之一}访问
turbine.appconfig 指定需要收集信息的服务名
turbine.clusterNameExpression 指定集群名称,默认表达式appName;此时:turbine.aggregator.clusterConfig需要配置想要监控的应用名称
3、 java 启动类
@EnableTurbine
@SpringBootApplication
public class TurbineApplication {
public static void main(String[] args) {
SpringApplication.run(TurbineApplication.class, args);
}
}
springboot 2.0 版本请参考一下
开启turbine监控
如果只开启hystrix的dashboard,监控每个服务的hystrix状态的话,需要一个一个服务去输入http://ip:port/actuator/hystrix.stream,非常麻烦。
通过turbine可以把所有服务的hystrix.stream聚合到一起,可以进行整体监控。
hystrix dashboard—->turbine.stream—>聚合集群下各个服务的hystrix.stream
turbine会把同一个conmmandKey的Hystrix命令合并
引入pom依赖
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-turbine</artifactId>
</dependency>
启动类上加上@EnableTurbine注解
@SpringCloudApplication
@EnableHystrixDashboard
@EnableTurbine
public class App {
public static void main(String[] args) {
//new SpringApplicationBuilder(ServiceRegistryApplication.class).web(true).run(args);
SpringApplication.run(App.class, args);
}
}
turbine的配置文件
turbine:
app-config: scfl-service-gateway ##需要监控的服务名
aggregator:
clusterConfig: default ##需要监控的服务集群名
clusterNameExpression: new String("default")
combine-host: true
instanceUrlSuffix:
default: actuator/hystrix.stream ##key是clusterConfig集群的名字,value是hystrix监控的后缀,springboot2.0为actuator/hystrix.stream
启动引用,访问http://localhost:50003/hystrix,再输入http://localhost:50003/turbine.stream 进行监控
可以看到,如果用turbine的话,监控地址为本服务的ip+port+/turbine.stream,如果不用turbine的话,监控地址为各个服务的ip+port+/actuator/hystrix.stream
turbine配置文件详解
turbine监控服务的配置:
turbine:
app-config: i5xforyou-biz-kanjia,i5xforyou-service-gateway ##需要监控的服务名
aggregator:
clusterConfig: kanjia,gateway ##需要监控的服务集群名,default
clusterNameExpression: metadata['cluster'] ##new String("default")
combine-host: true
instanceUrlSuffix:
kanjia: kanjia/actuator/hystrix.stream ##key为clusterConfig的集群名字,默认为default
gateway: actuator/hystrix.stream ##value为集群的hystrix监控url后缀,springboot2.0默认为actuator/hystrix.stream
turbine被监控客户端的配置:需要配置集群名
eureka:
instance:
metadata-map:
cluster: kanjia
default集群的stream路径为:http://ip:port/turbine.stream
有cluster的stream路径为:http://ip:port/turbine.stream?cluster=xxxxx
上一篇: 算法:广度优先搜索(BFS)与队列
推荐阅读
-
Nacos(四):SpringCloud项目中接入Nacos作为配置中心
-
springboot2.0和springcloud Finchley版项目搭建(包含eureka,gateWay,Freign,Hystrix)
-
Oracle学习笔记(四)
-
springcloud学习之路: (四) springcloud集成Hystrix服务保护
-
springcloud 熔断器Hystrix的具体使用
-
NumPy 学习笔记(四)
-
ios蓝牙开发学习笔记(四)ios蓝牙应用的后台处理
-
.NetCore学习笔记:四、AutoMapper对象映射
-
Orleans[NET Core 3.1] 学习笔记(四)( 2 )获取Grain的方式
-
SpringCloud Hystrix 监控仪表盘