故障总结备案表

请根据本次故障的实际情况,填写以下总结备案信息,以便我们进行分析和改进。
故障事件名称
    ____________
故障发生日期
日期    ____________
故障开始时间
时    ____________
分    ____________
故障结束时间
时    ____________
分    ____________
故障影响等级
P1-核心业务完全中断
P2-核心业务部分中断
P3-非核心业务中断
P4-轻微影响,用户可感知
P5-轻微影响,仅内部感知
故障影响范围
用户端
管理后台
API接口
数据库
服务器/网络
第三方服务
故障发现方式
监控告警
用户反馈
内部测试
巡检发现
其他
故障简要描述(现象)
    ____________
故障根因分类
代码缺陷/发布错误
配置变更
数据问题
硬件/网络故障
第三方依赖故障
容量不足
未知/待排查
故障根因详细分析
    ____________
采取的应急处理措施
服务重启
配置回滚
代码回滚
流量切换/限流
扩容
临时屏蔽功能
联系第三方支持
处理措施执行人
    ____________
故障是否完全恢复
否(部分恢复)
若未完全恢复,说明当前状态
    ____________
本次故障是否与历史故障类似
是,属于重复故障
否,属于新类型故障
若为重复故障,请说明关联故障ID或简述
    ____________
暴露出的问题
监控覆盖不全/告警不及时
变更流程不规范
容量规划不足
应急预案缺失/不完善
代码质量/测试覆盖不足
文档缺失/不准确
人员操作失误
架构设计缺陷
针对根因的改进措施(短期)
    ____________
针对暴露问题的改进措施(长期)
    ____________
改进措施负责人(部门/个人)
研发部
运维部
测试部
产品部
架构组
跨部门联合
短期改进措施计划完成日期
日期    ____________
长期改进措施计划完成日期
日期    ____________
故障复盘是否已完成
否,计划中
计划复盘会议日期
日期    ____________
复盘会议记录存放链接
    ____________
本次故障是否需对外公告
是,已发布
是,待发布
故障记录人
    ____________
审核人
    ____________
审核日期
日期    ____________

29题 | 被引用0次

模板修改
使用此模板创建