谷歌云误删用户账户导致数据丢失业务长时间瘫痪

据《卫报》报道,谷歌云服务近日发生了一起前所未见的重大配置错误事故,导致澳大利亚 UniSuper 基金云订阅账户被删除,服务中断长达一周。
UniSuper 是一支非盈利性的养老基金,管理着约 1250 亿美元的庞大资金,投资者超五十万人。
虽然 UniSuper 在谷歌云的两个云区域中做了数据备份,但本次重大事故是账户被删除引起的,导致两份备份同时丢失,没有起到保护作用。
好在 UniSuper 在其他存储服务商处也进行了数据备份,这在最大程度上减少了本次事故带来的损失,并加速了 UniSuper 恢复谷歌云上数据的过程。

事件:

近日,谷歌云 1服务遭遇了一起前所未有的重大故障,导致金融服务提供商UniSuper的私有云账户被意外删除,引发了广泛关注和讨论。以下是对这起事件的详细回顾。

超大基金老板和谷歌云全球首席执行官共同发表了一份联合声明,对这次“极其令人沮丧、极其令人失望”的故障事件向受影响的用户表示了深深的歉意。

谷歌云误删用户账户导致数据丢失业务长时间瘫痪

UniSuper基金的50多万会员在整整一周内无法访问各自的退休金账户。服务在系统宕机一个多星期后开始陆续恢复,投资账户余额将显示上周的金额数据。

UniSuper首席执行官Peter Chun向会员保证,这次故障并非网络攻击所致,且没有个人数据在故障中泄露。故障原因是谷歌云在配置UniSuper的私有云服务期间,发生了一个意外的错误配置,导致UniSuper的私有云订阅账户被删除。

谷歌云误删用户账户导致数据丢失业务长时间瘫痪

谷歌云首席执行官Thomas Kurian确认,这次中断是由一连串前所未有的事件引起的。谷歌云已经查明了导致这次中断的事件,并已采取了措施,确保不再发生类似事件。

尽管UniSuper通常在两个地区都备有副本以确保服务的可靠性,但由于云订阅账户被删除,两个地区的云实例都被删除。最终,由于另一家供应商的备份,UniSuper能够恢复服务。这次事件凸显了数据备份在云服务中的重要性。

UniSuper与谷歌云的团队通力合作,全面恢复了所有的核心系统,包括数百个虚拟机、数据库和应用程序。这次合作展示了在面对重大故障时,云服务提供商与客户之间的紧密协作至关重要。

UniSuper旗下管理着大约1250亿美元的资金,这起事件对如此大规模的资金管理公司来说无疑是一次严峻的考验。

观点:

如果说 阿里云全球服务不可用 大故障称得上是 “史诗级”,那么 Google 云上的这一次故障堪称 “无双级” 了。前者主要涉及服务的可用性,而这次故障直击许多企业的命根 —— 数据完整性。

据我所知这应当是云计算历史上的新纪录 —— 第一次如此大规模的删库。上一次类似的数据完整性受损事件还是 腾讯云与 “前言数控” 的案例。

但一家小型创业公司与掌管千亿美金的大基金完全不可同日而语;影响的范围与规模也完全不可同日而语 —— 整个云账户下的所有东西都没了!

这次事件再次展示了(异地、多云、不同供应商)备份的重要性 —— UniSuper 是幸运的,他们还有其他备份。

但如果你相信公有云厂商在其他的区域 / 可用区的数据备份可以帮你“兜底”,那么请记住这次案例 —— 避免 Vendor Lock-in,并 Always has Plan B。

参考:

英国卫报关于此次事件的报道:
https://www.unisuper.com.au/about-us/media-centre/2024/a-joint-statement-from-unisuper-and-google-cloud

UniSuper CEO 与 Google云 CEO 联合声明:
https://www.unisuper.com.au/about-us/media-centre/2024/a-joint-statement-from-unisuper-and-google-cloud

原创文章,作者:首席安全官,如若转载,请注明出处:https://cncso.com/google-cloud-configuration-error-causes-user-data-loss.html

(1)
上一篇 2024年5月7日 下午8:17
下一篇 2024年5月17日 上午7:00