事件:
近日,谷歌云 1服务遭遇了一起前所未有的重大故障,导致金融服务提供商UniSuper的私有云账户被意外删除,引发了广泛关注和讨论。以下是对这起事件的详细回顾。
超大基金老板和谷歌云全球首席执行官共同发表了一份联合声明,对这次“极其令人沮丧、极其令人失望”的故障事件向受影响的用户表示了深深的歉意。
UniSuper基金的50多万会员在整整一周内无法访问各自的退休金账户。服务在系统宕机一个多星期后开始陆续恢复,投资账户余额将显示上周的金额数据。
UniSuper首席执行官Peter Chun向会员保证,这次故障并非网络攻击所致,且没有个人数据在故障中泄露。故障原因是谷歌云在配置UniSuper的私有云服务期间,发生了一个意外的错误配置,导致UniSuper的私有云订阅账户被删除。
谷歌云首席执行官Thomas Kurian确认,这次中断是由一连串前所未有的事件引起的。谷歌云已经查明了导致这次中断的事件,并已采取了措施,确保不再发生类似事件。
尽管UniSuper通常在两个地区都备有副本以确保服务的可靠性,但由于云订阅账户被删除,两个地区的云实例都被删除。最终,由于另一家供应商的备份,UniSuper能够恢复服务。这次事件凸显了数据备份在云服务中的重要性。
UniSuper与谷歌云的团队通力合作,全面恢复了所有的核心系统,包括数百个虚拟机、数据库和应用程序。这次合作展示了在面对重大故障时,云服务提供商与客户之间的紧密协作至关重要。
UniSuper旗下管理着大约1250亿美元的资金,这起事件对如此大规模的资金管理公司来说无疑是一次严峻的考验。
观点:
如果说 阿里云全球服务不可用 大故障称得上是 “史诗级”,那么 Google 云上的这一次故障堪称 “无双级” 了。前者主要涉及服务的可用性,而这次故障直击许多企业的命根 —— 数据完整性。
据我所知这应当是云计算历史上的新纪录 —— 第一次如此大规模的删库。上一次类似的数据完整性受损事件还是 腾讯云与 “前言数控” 的案例。
但一家小型创业公司与掌管千亿美金的大基金完全不可同日而语;影响的范围与规模也完全不可同日而语 —— 整个云账户下的所有东西都没了!
这次事件再次展示了(异地、多云、不同供应商)备份的重要性 —— UniSuper 是幸运的,他们还有其他备份。
但如果你相信公有云厂商在其他的区域 / 可用区的数据备份可以帮你“兜底”,那么请记住这次案例 —— 避免 Vendor Lock-in,并 Always has Plan B。
參考:
英国卫报关于此次事件的报道:
https://www.unisuper.com.au/about-us/media-centre/2024/a-joint-statement-from-unisuper-and-google-cloud
UniSuper CEO 与 Google云 CEO 联合声明:
https://www.unisuper.com.au/about-us/media-centre/2024/a-joint-statement-from-unisuper-and-google-cloud
原创文章,作者:首席安全官,如若转载,请注明出处:https://cncso.com/tw/google-cloud-configuration-error-causes-user-data-loss-html