回顾一次生产问题

kyaa111 3年前 ⋅ 793 阅读

有几个原因造成这些问题

  1. 我没有对这种异步系统进行流程分析
    • 第三方系统可能因为网络不稳定导致关键表数据流程响应时间变长, 而依赖关键表数据的其他表当所依赖的数据不存在时, 没有进行消息补偿
  2. 我不熟悉RocketMQ的特性以及机制
    • 错误使用顺序消息, RocketMQ顺序消息失败重试会阻塞当前队列, 导致其他没有逻辑关联的消息不能正常消费
  3. 我对数据库操作把控不严
    • 第三方系统的实施人员执行了错误SQL

不过, 真正的我只是一个普普通通的一线开发而已