关于2021年1月29日交易服务故障的说明
1. 故障说明:
欧易OKX站的交易服务在2021年1月29日17:37:00 HKT~18:18:00 HKT期间出现间歇性的网站访问异常和交易异常的故障。
经调查:由于29日下午短暂时间内,访问网站流量过大,导致缓存系统的带宽网络不足,内部服务之间调用超时,WEB、APP、API端服务器间歇性异常。
发生过程应对摘要:
截至2021-01-29 17:37:00 HKT,我们的检测系统发现系统出现异常。
截至2021-01-29 17:37:00 HKT,WEB和APP上无行情和深度数据展示,API交易会间歇性返回 “30012”错误码,提示“Invalid Authority”。
截至2021-01-29 17:40:00 HKT,经过相关开发人员紧急排查,找到系统异常点,短时间内流量过大,导致缓存系统的带宽网络不足,内部服务之间调用超时。立即启动事件响应程序,紧急进行修复。
截至2021-01-29 17:58:00 HKT,WEB和APP恢复行情数据展示和交易功能。
截至2021-01-29 18:05:00 HKT,由于内部服务调用超时,永续合约的API服务事件处理堵塞,接口出现请求超时。
截至2021-01-29 18:18:00 HKT,永续合约的API交易服务恢复。
2. 我们通过做哪些工作保证欧易OKX平台的稳定性?
欧易OKX提供7*24全天候的交易服务,我们致力于为所有用户提供一个稳定、不间断的交易服务平台。但是由于高性能交易系统非常复杂,各种异常情况非常多,与所有交易系统一样,我们无法保证系统100%稳定运行。但是我们一直在从各个方面努力,提升系统稳定性,最大程度的减少停机出现的概率,包括:
1). 加强工程质量保证,优化测试体系;新功能代码在模拟盘稳定运行一段时间后才能上线
2). 架构升级,正在实现多机和多地域高可用,减少硬件、软件造成的宕机时间
3). 实现热更新,无状态逻辑实现热更新,减少升级对用户交易的影响
3. 如何获取系统更新?
1).在发生故障之后,我们会在Status页面发布故障说明。
2).当有新的系统升级事件时,我们会在Status页面发布通知;并通过市场和社群的渠道(API用户社群+普通用户社群)及时通知广大用户;同时API用户可以通过订阅system/status频道来实时获取通知。