详细介绍高性能Java缓存库Caffeine

程序员文章站 2023-12-01 15:08:34

1、介绍在本文中，我们来看看caffeine — 一个高性能的 java 缓存库。缓存和 map 之间的一个根本区别在于缓存可以回收存储的 item。回收策略为...

1、介绍

在本文中，我们来看看caffeine — 一个高性能的 java 缓存库。

缓存和 map 之间的一个根本区别在于缓存可以回收存储的 item。

回收策略为在指定时间删除哪些对象。此策略直接影响缓存的命中率 — 缓存库的一个重要特征。

caffeine 因使用 window tinylfu 回收策略，提供了一个近乎最佳的命中率。

2、依赖

我们需要在 pom.xml 中添加 caffeine 依赖：

<dependency>
  <groupid>com.github.ben-manes.caffeine</groupid>
  <artifactid>caffeine</artifactid>
  <version>2.5.5</version>
</dependency>

您可以在maven central 上找到最新版本的 caffeine。

3、填充缓存

让我们来了解一下 caffeine 的三种缓存填充策略：手动、同步加载和异步加载。

首先，我们为要缓存中存储的值类型写一个类：

class dataobject {
  private final string data;
 
  private static int objectcounter = 0;
  // standard constructors/getters
   
  public static dataobject get(string data) {
    objectcounter++;
    return new dataobject(data);
  }
}

3.1、手动填充

在此策略中，我们手动将值放入缓存之后再检索。

让我们初始化缓存：

cache<string, dataobject> cache = caffeine.newbuilder()
 .expireafterwrite(1, timeunit.minutes)
 .maximumsize(100)
 .build();

现在，我们可以使用 getifpresent 方法从缓存中获取一些值。如果缓存中不存在此值，则此方法将返回 null：

string key = "a";
dataobject dataobject = cache.getifpresent(key);
 
assertnull(dataobject);

我们可以使用 put 方法手动填充缓存：

cache.put(key, dataobject);
dataobject = cache.getifpresent(key);
 
assertnotnull(dataobject);

我们也可以使用 get 方法获取值，该方法将一个参数为 key 的 function 作为参数传入。如果缓存中不存在该键，则该函数将用于提供回退值，该值在计算后插入缓存中：

dataobject = cache
 .get(key, k -> dataobject.get("data for a"));
 
assertnotnull(dataobject);
assertequals("data for a", dataobject.getdata());

get 方法可以原子方式执行计算。这意味着您只进行一次计算 — 即使多个线程同时请求该值。这就是为什么使用 get 优于 getifpresent。

有时我们需要手动使一些缓存的值失效：

cache.invalidate(key);
dataobject = cache.getifpresent(key);
 
assertnull(dataobject);

3.2、同步加载

这种加载缓存的方法使用了与用于初始化值的 function 相似的手动策略的 get 方法。让我们看看如何使用它。

首先，我们需要初始化缓存：

loadingcache<string, dataobject> cache = caffeine.newbuilder()
 .maximumsize(100)
 .expireafterwrite(1, timeunit.minutes)
 .build(k -> dataobject.get("data for " + k));

现在我们可以使用 get 方法检索值：

dataobject dataobject = cache.get(key);
 
assertnotnull(dataobject);
assertequals("data for " + key, dataobject.getdata());

我们也可以使用 getall 方法获取一组值：

map<string, dataobject> dataobjectmap 
 = cache.getall(arrays.aslist("a", "b", "c"));
 
assertequals(3, dataobjectmap.size());

从传递给 build 方法的底层后端初始化函数检索值。这使得可以使用缓存作为访问值的主要门面（facade）。

3.3、异步加载

此策略的作用与之前相同，但是以异步方式执行操作，并返回一个包含值的 completablefuture：

asyncloadingcache<string, dataobject> cache = caffeine.newbuilder()
 .maximumsize(100)
 .expireafterwrite(1, timeunit.minutes)
 .buildasync(k -> dataobject.get("data for " + k));

我们可以以相同的方式使用 get 和 getall 方法，同时考虑到他们返回的是 completablefuture：

string key = "a";
 
cache.get(key).thenaccept(dataobject -> {
  assertnotnull(dataobject);
  assertequals("data for " + key, dataobject.getdata());
});
 
cache.getall(arrays.aslist("a", "b", "c"))
 .thenaccept(dataobjectmap -> assertequals(3, dataobjectmap.size()));

completablefuture 有许多有用的 api，您可以在中获取更多内容。

4、值回收

caffeine 有三个值回收策略：基于大小，基于时间和参考。

4.1、基于大小回收

这种回收方式假定当超过配置的缓存大小限制时会发生回收。获取大小有两种方法：缓存中计数对象，或获取权重。

让我们看看如何计算缓存中的对象。当缓存初始化时，其大小等于零：

loadingcache<string, dataobject> cache = caffeine.newbuilder()
 .maximumsize(1)
 .build(k -> dataobject.get("data for " + k));
 
assertequals(0, cache.estimatedsize());

当我们添加一个值时，大小明显增加：

cache.get("a");
 
assertequals(1, cache.estimatedsize());

我们可以将第二个值添加到缓存中，这导致第一个值被删除：

cache.get("b");
cache.cleanup();
 
assertequals(1, cache.estimatedsize());

值得一提的是，在获取缓存大小之前，我们调用了 cleanup 方法。这是因为缓存回收被异步执行，这种方法有助于等待回收的完成。

我们还可以传递一个 weigher function 来获取缓存的大小：

loadingcache<string, dataobject> cache = caffeine.newbuilder()
 .maximumweight(10)
 .weigher((k,v) -> 5)
 .build(k -> dataobject.get("data for " + k));
 
assertequals(0, cache.estimatedsize());
 
cache.get("a");
assertequals(1, cache.estimatedsize());
 
cache.get("b");
assertequals(2, cache.estimatedsize());

当 weight 超过 10 时，值将从缓存中删除：

cache.get("c");
cache.cleanup();
 
assertequals(2, cache.estimatedsize());

4.2、基于时间回收

这种回收策略是基于条目的到期时间，有三种类型：

访问后到期 — 从上次读或写发生后，条目即过期。
写入后到期 — 从上次写入发生之后，条目即过期
自定义策略 — 到期时间由 expiry 实现独自计算

让我们使用 expireafteraccess 方法配置访问后过期策略：

loadingcache<string, dataobject> cache = caffeine.newbuilder()
 .expireafteraccess(5, timeunit.minutes)
 .build(k -> dataobject.get("data for " + k));

要配置写入后到期策略，我们使用 expireafterwrite 方法：

cache = caffeine.newbuilder()
 .expireafterwrite(10, timeunit.seconds)
 .weakkeys()
 .weakvalues()
 .build(k -> dataobject.get("data for " + k));

要初始化自定义策略，我们需要实现 expiry 接口：

cache = caffeine.newbuilder().expireafter(new expiry<string, dataobject>() {
  @override
  public long expireaftercreate(
   string key, dataobject value, long currenttime) {
    return value.getdata().length() * 1000;
  }
  @override
  public long expireafterupdate(
   string key, dataobject value, long currenttime, long currentduration) {
    return currentduration;
  }
  @override
  public long expireafterread(
   string key, dataobject value, long currenttime, long currentduration) {
    return currentduration;
  }
}).build(k -> dataobject.get("data for " + k));

4.3、基于引用回收

我们可以将缓存配置为启用缓存键值的垃圾回收。为此，我们将 key 和 value 配置为弱引用，并且我们可以仅配置软引用以进行垃圾回收。

当没有任何对对象的强引用时，使用 weakrefence 可以启用对象的垃圾收回收。softreference 允许对象根据 jvm 的全局最近最少使用（least-recently-used）的策略进行垃圾回收。有关 java 引用的更多详细信息，请参见。

我们应该使用 caffeine.weakkeys()、caffeine.weakvalues() 和 caffeine.softvalues() 来启用每个选项：

loadingcache<string, dataobject> cache = caffeine.newbuilder()
 .expireafterwrite(10, timeunit.seconds)
 .weakkeys()
 .weakvalues()
 .build(k -> dataobject.get("data for " + k));
 
cache = caffeine.newbuilder()
 .expireafterwrite(10, timeunit.seconds)
 .softvalues()
 .build(k -> dataobject.get("data for " + k));

5、刷新

可以将缓存配置为在定义的时间段后自动刷新条目。让我们看看如何使用 refreshafterwrite 方法：

caffeine.newbuilder()
 .refreshafterwrite(1, timeunit.minutes)
 .build(k -> dataobject.get("data for " + k));

这里我们应该要明白 expireafter 和 refreshafter 之间的区别。当请求过期条目时，执行将发生阻塞，直到 build function 计算出新值为止。

但是，如果条目可以刷新，则缓存将返回一个旧值，并异步重新加载该值。

6、统计

caffeine 有一种记录缓存使用情况的统计方式：

loadingcache<string, dataobject> cache = caffeine.newbuilder()
 .maximumsize(100)
 .recordstats()
 .build(k -> dataobject.get("data for " + k));
cache.get("a");
cache.get("a");
 
assertequals(1, cache.stats().hitcount());
assertequals(1, cache.stats().misscount());

我们也可能会传入 recordstats supplier，创建一个 statscounter 的实现。每次与统计相关的更改将推送此对象。

7、结论

在本文中，我们熟悉了 java 的 caffeine 缓存库。我们看到了如何配置和填充缓存，以及如何根据我们的需要选择适当的到期或刷新策略。

文中示例的源代码可以在 github 上找到。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持。

上一篇：微信青蛙Pro不只是刷脸，硬件成移动支付下半场“主旋律”？

下一篇：麦咭4G智能机器人开箱评测萌萌惹人爱

详细介绍高性能Java缓存库Caffeine

详细介绍高性能Java缓存库Caffeine

详细介绍高性能Java缓存库Caffeine

Java中有关数据库连接池c3p0配置的详细介绍

Java中有关数据库连接池c3p0配置的详细介绍