1. 首页
  2.  » 
  3. 新闻中心
  4.  » 故障告警超10分钟须上报?人民银行数据报送出新规

故障告警超10分钟须上报?人民银行数据报送出新规

by | Jun 17, 2021

金融业的核心系统被业内誉为“心脏”,在IT应用系统总体架构中有着至关重要的作用。随着金融强监管更加精细化,对金融业核心系统的保障能力也提出了更高要求。首先,金融业的容灾系统建设指标颇为严格,将不同的业务系统按重要程度进行划分,核心系统作为一类系统其RPO(Recovery Point Objective)与RTO(Recovery Time Objective)要求严格;其次,金融监管机构不断压缩故障报备时长,从过去“涉及客户服务的业务停机超30分钟须上报”到如今“核心业务系统发生故障告警超10分钟须报送”,金融行业数据报送的即时性在不断增强。

解读金融业数据报送新规

2020年5月,银保监会发布《关于开展监管数据质量专项数据治理工作的通知》,要求所有银行与保险类金融机构建立监管数据质量管控制度,切实保障数据质量,杜绝发生频繁数据迟报、漏报、错报等行为,同时建立适应监管数据报送工作需要的信息系统,提高监管数据加工的自动化程度。

2021年初,人民银行科技司开启了业务运行异常监测和假冒网站确认工单功能试运行的工作,要求各金融机构及时进行网络接入与数据上报,尤其是对触发告警参考指标且延续时间达10分钟以上的监测异常情况自动上传“业务运行异常监测工单”。工单上报的范围涉及资金类、外联类交易等核心系统,主要涵盖业务交易量、交易成功率和交易时延等监测指标。

从银保监会到人民银行,金融监管机构频发数据报送新规,旨在提高金融机构的业务数据监测质量,收紧业务数据报送标准,维护正常的金融秩序。

分析此次“业务运行异常监测工单”的对接,主要从2个关键词、1个问题入手。

两个关键词

精准

精准监测业务数据指标既是对银保监会数据质量管控制度的积极响应,也是落实人行数据报送新规的前提。从银保监会与人行科技司的通知中可以看出,与客户相关的业务系统是要求数据报送的主要对象。以人行新规为例,资金类、外联类交易等属于核心业务系统范畴,而业务交易量、交易成功率、交易时延这三项指标直接影响客户服务体验。

原先的性能监测偏差,或是因为告警机制不准确而带来的误告、漏告仅在行内解决即可,但在上级机构更为严格的监管之下,这些“漏洞”甚至会影响监管工作的正常运行。

 

实时

实时不仅体现在通过即时的业务运维监控保障业务数据指标监测的准确,更体现在监管层面,通过实时上报故障数据,维护正常的金融监管秩序。一旦丢失了实时性,精准的业务监控无从谈起。

过去数年,银保监会通报了数起因故障持续时间过长、影响客户服务体验的金融事件。这些金融机构未能在第一时间将异常数据上报至监管部门,且由于业务系统监测不精准、故障定位难,导致故障延续时长从1小时至数天不等,对正常的金融服务秩序造成了极大干扰。

早些年前,天旦BPC就已经拥有秒级与分钟级的数据输出功能,通过Restful API接口助力金融客户实时导出BPC精准的统计数据与交易明细数据,用于监管上报、实时营销、行长驾驶舱等业务运营创新场景。

一个问题

当我们考虑如何上报精准、实时的“业务运行异常监测工单”的同时,是否有办法提高告警响应与处理水平,尽量减少甚至没有异常工单需要上报呢?

金融机构内部通常有完整的灾备系统建设标准,尽管不同组织对核心业务系统的RPO与RTO标准制定上略有差异,但故障与业务的恢复时限均需满足银保监会的最低标准。本政策的要求显然对于金融机构运维部门的故障响应能力有了显著的提升。因此,接入系统的根本目的并不在于获得金融机构海量准确的异常工单,相反,它寄希望于通过监督管理让重大的故障越少越好,督促大家不断提升运维管理的水平。

 

选择更实时、精准的技术路线

监控数据源的实时性是实现监控指标精准、告警准确的基础。天旦互联数据技术通过旁路方式获取网络流量数据,具有实时、全量、精准的特性,是一种记录且真实反应交易每一个节点性能情况的过程数据。再加上高性能的互联数据引擎,天旦BPC告警精准的优势从第一步获取数据源开始就已经充分考虑。

 

设置更合理、精准的告警逻辑

采用不够科学的告警条件设置,比如单一的阈值告警,往往会造成海量的误告扑面而来,或是错漏了真正的故障对业务造成影响。如果将阈值设定与基线设定两种方式相结合,同时基于充分的历史数据进行告警模拟,将不确定性放在真实的数据中智能试验与推演,方可保障告警的实时与准确,甚至通过合理的数值设定,在故障对业务造成影响前就及时感知、防微杜渐。

 

拥有更高效的排障方法

我们无法100%杜绝故障的发生,但可以借助工具不断提高故障定位、诊断的能力,缩短排障时间。相较于十几年前,排障主要靠“人肉”的模式,智能化时代已经出现了非常多能够高效定位故障、分析故障的工具。BPC在设计时就充分考虑了业务运维的难点,基于端到端的监控节点覆盖,通过自动化故障定位、单笔交易追踪等功能,提供由浅入深、由点及面的故障分析能力,可在短时间内帮助运维人员找出故障根因并提供充分的依据,进而实现高效排障。

 

根据人行要求,国有六大行、政策性银行与13家大型股份制商业银行需在2021年6月底完成“业务运行异常监测工单”的对接,之后会有更多的银行需要完成工单接入。天旦业务性能管理BPC可以帮助金融机构夯实运维基础,建立精准、实时的业务监控体系,即时进行故障告警,助力运维人员快速排障,提高运维效率,减少或杜绝异常数据或工单的报送。

– end –

凝心聚力、志在四方,天旦荣获“华为FPGGP 2022年度最佳贡献奖”

天旦获得华为的高度认可,荣获华为“2022年度FPGGP最佳贡献奖”、解决方案开发基金&营销基金等多项殊荣。

天旦出席全球智慧金融峰会2023,AIOps为智慧金融注入新活力

出席华为Gauss生态圈发布、携手发布“分布式新核心全链路智能运维联合解决方案”,天旦全方位亮相华为智慧金融峰会2023。

天旦出席华为亚太合作伙伴大会2023

5月17日,华为亚太合作伙伴大会2023正式开幕,天旦受邀出席亚太合作伙伴联盟发布仪式,并发表圆桌演讲。

关注天旦公众号

跟旦旦一起,

让运维稳定无忧,

运营做你所想。