以太坊2.0 POS挖矿(ETH2 Staking)教程（一）Topaz测试网-监控篇

程序员文章站 2024-01-27 14:23:10

...

在上一篇教程中已经介绍了开启Staking的方法：
以太坊2.0 POS挖矿(ETH2 Staking)教程（一）Topaz测试网

由于Staking要求验证着24/7保持在线才能持续获得收益，如果验证者离线一小段时间，将会有少量的惩罚；如果长时间离线，惩罚金额会随着时间大幅上升。关于该机制的简单介绍，可见这篇文章中的“验证者激励措施”部分。
因此，有必要对Staking进行实时监控，以便在出现问题时接收到告警并及时处理，避免损失扩大。
本文将从简单到复杂，介绍几种监控的方法。

准备工作——获取验证者public key

1. 从存款交易获取

打开metamask，找到那笔32ETH的存款交易，然后点击“通过etherscan浏览”。可看到那笔交易对应的验证者public key。

2. 从验证者**目录查看

进入**目录后查看validatorprivate****的文件，找到"publickey"部分即可。

# 进入目录
cd ~/.eth2validators
# 打开validatorprivate开头的文件
vim validatorprivatekey*****
# 打开后找到"publickey"部分即可

区块链浏览器查看验证者状态

最简单的方式就是通过访问区块链浏览器网站监控验证者状态。https://beaconcha.in或者https://beacon.etherscan.io，输入Public Key即可查看当前状态和历史收益。
以太坊2.0 POS挖矿(ETH2 Staking)教程（一）Topaz测试网-监控篇

使用云主机服务提供商的的监控看板

大部分云主机服务提供商都提供了主机性能监控和告警的功能。如果在云主机上进行Staking，可使用云服务上提供的资源监控告警功能。
信标链客户端占用内存大约在2.5GB-3.5GB之间，进程如果终止内存会导致内存骤降，可通过内存使用率/使用量的异常进行侧面监控。
同时可对网络流量、机器是否正常运行设置更多维度的监控。

通过prometheus监控

Prometheus是一款流行的实时监控工具。按照要求开发服务并设置监听端口后，可通过prometheus访问端口获取数据进行监控。
prysm已经内置了针对prometheus的监听服务，因此可以只需对prometheus进行简单的配置即可对信标链和验证者客户端进行监控。
如果想自行研究，可参考官方教程。以下是简要步骤：

下载相应的prometheus安装包到本地：Download the latest release
解压并进入目录：

tar xvfz prometheus-*.tar.gz
cd prometheus-*

用screen新建一个session并启动prometheus:

# 新建一个session
screen -S prometheusETH2
# 启动prometheus
./prometheus --config.file=prometheus.yml
# 启动完成后按住CTRL+A+D退出session

修改配置文件prometheus.yml
默认的配置文件底部可看到- targets: ['localhost:9090']，表示进程会从本机9090端口抓取数据。9090是prometheus提供的监控自己运行指标的端口。prysm的信标链和验证者的指标端口分别是8080和8081，将两个端口加入到配置文件的targets即可。完成后的prometheus.yml如下：

# my global config
global:
  scrape_interval:     15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
  evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.
  # scrape_timeout is set to the global default (10s).

# Alertmanager configuration
alerting:
  alertmanagers:
  - static_configs:
    - targets:
      # - alertmanager:9093

# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files:
  # - "first_rules.yml"
  # - "second_rules.yml"

# A scrape configuration containing exactly one endpoint to scrape:
# Here it's Prometheus itself.
scrape_configs:
  # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.
  - job_name: 'prometheus'

    # metrics_path defaults to '/metrics'
    # scheme defaults to 'http'.

    static_configs:
    - targets: ['localhost:9090']

  # 添加以下targets以监控信标链和验证者
  - job_name: 'beacon-chain'
    static_configs:
    - targets: ['localhost:8080']

  - job_name: 'validator'
    static_configs:
    - targets: ['localhost:8081']

修改完成后，通过promtool检查配置文件正确性：

./promtool check config prometheus.yml

验证无误后可以看到如下信息：

Checking prometheus.yml
  SUCCESS: 0 rule files found

使prometheus重新载入配置文件
通过ps -aux | grep prometheus找到prometheus运行的进程号（PID），并通过以下命令通知该进程重新载入配置文档：

kill -HUP PID

查看监控指标
通过本机访问http://localhost:9090即可看到prometheus的图形化监控页面。如果使用linux云主机，则需要开放9090,8080,8081三个端口并通过浏览器访问服务器。
点击菜单栏的Status >> Targets可看到配置文件中设置的targets：

回到prometheus
点击Endpoint中的链接可看到看到该target中的所有指标。
进入validator的Endpoint(http://localhost:8081/metrics)，可在页面底部看到验证者相关指标：

选取其中的指标输入到Graph页面即可。例如想观测验证者的ETH余额增长情况，只需要点击菜单的Graph，输入validator_balance后点击Execute，并在下方切换到Graph标签即可查看走势（我这里有2个验证者，所以有2条曲线）：

点击下方的Add Graph可添加任意数量的图表，实现多个图表的看板。

优缺点

以上不同的监控方式各有优劣。对比如下：

	区块链浏览器	云主机监控告警	prometheus
监控维度	验证者节点状态和余额变动	主机性能指标波动	信标链和验证者的多项指标
指标丰富程度	少	一般	丰富
上手难度	简单	中等	较为复杂
是否需要信任第三方的区块链信息？	是	-	否
是否直接监控验证者？	是	否	是
主机断电或网络断开时是否有效？	是	是	否
风险点	网站数据有误、网站无法访问时无法监控	进程运行但执行异常时无法监控到	主机断电或网络断开时无法监测； prometheus进程终止或出现异常时监测功能失效。

综上，较为保险的做法是主机性能指标监控+prometheus，另外亦可将prometheus部署在另一台机器上，这样当主机宕机或网络断开时也能观测到异常指标。

监控有了，告警呢？

说了这么多，难道需要一个人啥事不干整天盯着指标吗？当然不是啦，下一篇就会介绍如何对异常进行告警。不要错过哦。