云开发基础之监控告警

来自CloudWiki
跳转至: 导航搜索

一、监控报警是什么:

1.产品介绍

 ●当用户需要云开发的监控告警能力时,可在环境中监控统计页查看到具体的监控告警能力
 ●用户可查看到当前环境云函数、数据库、云存储等不同资源的监控指标。可查看自己业务的使用情况,并观察业务是否有异常存在
 ●在某些指标改变时,云开发还支持创建告警来及时通知您采取措施
 ●告警在一-定周期内监控某些特定指标,并根据给定的阈值,每隔若干个时间段发送告警

2.告警策略

 ●当用户需要针对云开发某个资源对象的某个状态发送告警时,需要先创建告警策略
 ●告警策略主要由以下三个部分组成
   告警触发条件(什么条件下发送告警) :具体触发告警的规则,每个告警策略中可以创建多个触发条件
   告警对象( 哪个对象发出告警) :被告警的资源的对象,目前支持的对象为函数、数据库
   告警渠道(谁通过什么方式收到告警) :用户创建告警的最小单元,用户可以创建告警策略绑定在需要告警的对象上。一个告警策略可以绑定到多个对象
 ●告警触发条件根据监控对象的不同,会选择不同的监控维度
 ●云函数提供了运行时间和错误次数两个维度
 ●云数据库提供了基于数据库查询时长的三个维度

范例a.jpg

 ●告警触发条件根据要求,选择不同的用户或用户组进行通知,开发者可以根据业务实际情况,选择不同的告警组或告警渠道

范例dd.jpg

二、在控制台配置监控告警

1.配置云数据库监控

 ●场景模拟:业务SRE需要对系统性能进行监控,确保系统性能始终保持在较高水平
 ●实验配置一个针对数据库所有集合,监控数据查询时长在10 - 50毫秒的监控,并对指定用户进行通知

找到需要的环境:

范例q.jpg

新建集合:

范例w.jpg

创建监控报警:

范例e.jpg

首先新建策略(数据库)

范例r.jpg


3.配置云函数监控

●场景模拟:开发团队需要针对系统稳定性进行监控,确保上线业务出现问题后可以即时响应 ●实验配置一个针对函数错误次数进行监控,并在错误次数超过阈值后,对整个开发小组进行通知

新建策略(云函数):

范例t.jpg

建立完成:

范例j.jpg