所有洞见

CrowdStrike中断事件:在数据可靠性、可用性和弹性方面敲响的警钟

Octavian Tanase Octavian Tanase
Chief Product Officer

2024年7月26日


本周五,网络安全公司CrowdStrike的软件更新发生错误,引发全球IT中断,导致关键基础设施陷入瘫痪。

我写这篇文章有两个原因:首先,我想向我们的客户保证,Hitachi Vantara并未受到持续的Microsoft Windows蓝屏死机中断的影响,我们的业务运营(包括我们的ITaaS和混合云产品)继续顺利运行;我们将继续监控,以确保它们不会中断。其次,无论这次事件有多么棘手,从积极的一面来看,它都有可能为数据可靠性、可用性和弹性敲响警钟。继续阅读:

此次中断事件可能造成超过10亿美元的损失,opens in a new tab影响全球企业,凸显我们互联数字世界的脆弱性以及过度依赖集中式云服务的风险。虽然中断的根本原因是技术故障而非网络攻击,但这次事件暴露了服务中断对业务运营的潜在后果。

停机的高昂成本

CrowdStrike中断的影响深远,导致众多组织面临重大运营挑战,并凸显了停机带来的财务影响,包括收入损失、客户流失和品牌声誉受损。据Pingdom称,IT停机的平均成本为每小时10万美元opens in a new tab。此外,此次中断凸显了数据无法访问带来的潜在法律和监管风险,尤其是对于受严格合规标准约束的行业,例如银行、金融服务、医疗保健、交通和能源、航空公司和保险等领域。除了直接影响之外,此类中断还会对品牌声誉产生持久损害,Ponemon Institute的一项研究发现,数据泄露对公司声誉的平均成本为720万美元opens in a new tab

观看我们的网络研讨会:超越牢不可破?提供高数据中心可用性,详细了解如何缓解不可预测的数据中心故障,提供真正的高可用性。

对强大数据保护策略的需求

为了减轻与服务中断相关的风险,企业必须优先考虑数据可用性和弹性。以下是需要考虑的关键策略:

  • 混合云和多云策略:采用混合云或多云方法,可显著提高弹性和可用性。通过在多个云平台和本地基础设施上分配工作负载,企业可以减少对任何单一环境的依赖。这种多样化有助于减轻中断影响,确保业务连续性。
  • 灾难恢复规划:全面的灾难恢复计划大致列出了服务中断时应采取的步骤。快速恢复对于最大限度减少业务影响至关重要。企业应仔细规划包括数据恢复和系统重启在内的恢复步骤,并定期测试。
  • 数据复制和备份:实施强大的数据复制和备份程序,对于确保发生中断时的数据可访问性至关重要。应将数据的多个副本存储在分散的地理位置,以最大限度降低数据丢失的风险。
  • 云服务提供商评估:企业应仔细评估其云服务提供商的可靠性和性能。选择具有良好正常运行时间和灾难恢复能力记录的提供商至关重要。
  • 数据丢失防护(DLP):实施DLP解决方案有助于保护敏感数据免遭未经授权的访问、丢失或损坏。这些解决方案还可以协助数据恢复工作。

构建有弹性的数据基础设施

虽然CrowdStrike中断是一件大事,但它也为企业提供了加强数据保护和恢复能力的机会。通过投资强大的数据管理策略,构建有弹性的基础设施,企业可以更好地抵御未来的中断,最大限度减少对运营的影响。

人工智能可以显著增强基础设施的弹性。通过分析大量数据集,人工智能可以预测故障、优化资源分配并检测异常。在CrowdStrike的案例中,人工智能可以在软件问题造成大面积破坏之前识别出表明存在问题的现象。

值得注意的是,数据可用性和弹性是一个持续的过程。定期测试和更新灾难恢复计划对于确保其有效性至关重要。此外,企业应随时了解新出现的威胁和漏洞,以主动应对潜在风险。

CrowdStrike中断事件有力地提醒了我们,数据在现代业务运营中发挥的关键作用。通过优先考虑数据可用性和弹性,企业可以为未来的成功奠定更坚实的基础。

DZ BANK:类云经济性和高可用性

德国领先的金融机构DZ BANK面临着管理和扩展关键任务数据存储并优化成本的挑战。该银行需要一种能够满足其高性能交易应用程序需求的解决方案,同时提供类似云的灵活性和成本效率。

为了应对这些挑战,DZ BANK正在转向混合云战略,根据需要在本地基础设施和云之间动态转移工作负载。作为其优化战略的一部分,他们整合了存储系统,标准化了数据基础设施,简化了架构,并与Hitachi Vantara合作,确保其关键任务交易应用程序具有最高的可用性和性能。最终结果:具有高可用性的类云经济性。

这是一个持续旅程,而非一个目的地

构建弹性数据基础设施是一个持续的过程,而不是一蹴而就的。它需要一种融合技术、战略和人力专业知识的整体方法。通过利用人工智能和混合云基础设施,企业可以主动防御不断演变的威胁,保护宝贵的数据资产。真正的弹性在于不断追求改进、适应和警惕,认识到威胁形势总是在变化。

随着对跨行业业务连续性需求的持续关注,企业领导者必须考虑采用多层次的方法来实现数据的可靠性、可用性和弹性,包括本地、云和混合解决方案,以及强大的灾难恢复计划。

探索如何实现具有高可用性的灵活混合云生态系统,以满足您当下和未来的需求。

其他资源