阿里云服务器监控与报警功能配置及使用指南
阿里云服务器的监控与报警功能配置及使用指南如下:
- 从菜单栏搜索云监控进入到云监控相关的界面。
- 选择云监控页面下左边菜单栏的报警服务。
- 创建报警规则,报警规则创建的过程中,对产品、资源范围、通道沉默周期、生效时间,报警人联系组按照字面意思进行添加即可,其中通道沉默周期是指报警完第一次后多久进行第二次报警。规则描述是对相关资源设置报警阀值,一般选用多指标,满足一个关系即可报警。设置完成后,可以使用监控图标预览功能进行预览。相关资源阀值如下:
- CPU:内存箭头指向的两处均可作为内存的监控。
- 带宽:带宽一般只关注流出带宽,流入一般不在购买的带宽限制之内。例如4M带宽其限制的流出带宽最高为4M。
- 系统盘使用率:此处是对挂载的系统盘进行监控。
若你需要对GPU利用率、显存利用率、显存占用、功率、温度等关键信息进行监控和报警,可以参考使用云监控实现GPU云服务器的GPU监控和报警(上) - 自定义监控。