7月份,CrowdStrike的一次软件升级尝试不幸失败,导致了一场前所未有的全球技术灾难。据统计,多达850万台Windows电脑因此出现中断现象,这一事件迅速波及多个领域,航班停飞、医院预约中断、广播公司停播,社会运转陷入一片混乱。
在这起事件发生后,SentinelOne的高管们迅速抓住时机,公开对CrowdStrike进行了批评,并顺势宣传起了自家的产品。而Trellix的CEO也站了出来,保证他们的产品绝不会引发类似事件,同时强调他们一直坚持采取保守安全的方法来升级软件。
面对这样的局面,CrowdStrike的总裁显然不甘示弱,他批评竞争对手们利用这一事件恐吓客户、窃取市场份额。而商业分析师们也指出,众多网络安全供应商都在趁机利用CrowdStrike的这次事故来推销自己的产品,行业内的乱象可见一斑。
然而,对于广大用户来说,无论选择哪家供应商的产品, CrowdStrike和其他竞争者都需要有应对这些问题的预案。
在软件更新发布前,进行彻底的测试是至关重要的。这包括单元测试、集成测试和压力测试,以确保更新不会对系统的稳定性造成任何影响。
更新应该逐步推出,先在小范围内进行部署并监控其表现,然后再逐步扩大到更广泛的用户群体。
实施实时监控是快速检测和响应系统异常的关键。通过实时监控,可以迅速发现并解决潜在问题,从而减少其影响范围。
在设计系统时,应该考虑冗余性。确保关键组件有备份是非常重要的,这样当主系统出现问题时,可以迅速切换到备份系统,保证服务的连续性。
制定并定期测试灾难恢复计划也是必不可少的。这样,在发生严重故障时,就能迅速恢复服务,减少损失。
确保所有系统都及时接收安全补丁和更新是非常重要的。这样可以有效减少被攻击的风险,提高系统的安全性。
提高用户对网络安全的认识也是关键之一。通过教育用户识别潜在的威胁和正确响应中断事件,可以在很大程度上减少中断事件的影响。
但是, CrowdStrike的事件也告诫我们,虽然背靠大树好乘凉,但是当发生问题时,不仅自身也给微软带来了巨大的麻烦。而受伤最深的莫过于CrowdStrike,打铁还需要自身硬!