近日,一家创业公司——前沿数控在微博上发表长文《腾讯云给一家创业公司带来的灾难》,引起业界广泛关注和热议。究其原因:腾讯云弄丢了这家公司的全部数据!
事件发生在7月20日,“前沿数控”的网站、小程序、H5均出现无法打开的问题,经检查后发现无法登陆腾讯云服务器。最终腾讯云给出的答复是:数据100%找不回来了。前沿数控表示,近千万元级的平台数据全部丢失,包括经过长期推广导流积累起来的精准注册用户以及内容数据。
为什么会发生数据丢失?腾讯云在公告中表示,本次事故起源自因磁盘静默错误导致的单副本数据错误,再由于数据迁移过程中的不规范操作,导致异常数据扩散至三副本,进而导致客户数据完整性受损。
“简单类比,就是电脑的c盘(装操作系统的盘)因为底层错误而导致数据读写异常,又加上数据迁移过程中的违规操作,最终挂掉了,然后客户的系统和数据都丢了。”一位云服务行业从业人士表示。
不管对于腾讯云,还是对于“前沿数控”来说,“数据丢失”都是一次惨痛教训。为了避免类似恶性事件再次发生,无论是企业还是个人都应该有防备措施,制定并实施必要的数据保护措施。
由此我们可以看出,选用安全可靠存储的重要性。对于关键数据尽可能采用多副本分布式存放、启用全流程数据校验,提高数据的可靠性。例如鹏云网络ZettaStor分布式存储产品就能很好地完成此类需求,不仅提供完善的数据保护机制,还可以提供最多99.9999999%的数据可靠性;ZettaStor把数据安全、业务连续性做为产品设计的首要目标,按照电信运营级的要求设计,可以满足用户对数据保护的根本需求。
ZettaStor提供多重站点内数据保护机制:
- 1. 可以根据用户需要配置副本冗余策略,最多支持9个副本。并提供基于日志的专利技术保证副本间数据的一致性,在缓存层和持久化层都能够保证。
- 2. 提供全流程的数据校验机制,来确保用户数据被正确地存取访问。当用户数据进入Zettastor DBS存储系统之初,系统就为该数据生成一个校验码,此后数据在系统中的每一次传递过程中都会进行数据校验,只有正确无误的数据才会被接受,直至最终写入底层存储介质。这样可以避免数据迁移过程中,由于某些原因导致数据缺失而造成的数据不可用。
上述两点也正是此次腾讯云发生故障的症结所在,ZettaStor设计之初就给出充分的重视。
此外,鹏云网络ZettaStor还提供:
1. 采用非易失性内存(NVDIMM)或者固态硬盘保存日志,保证系统整体掉电数据也不会丢失。
- 2. 超强的容错能力,3副本情况下能容忍同一站点内2/5的节点/磁盘故障,数据不会丢失,业务也不会中断。
对于特别关键数据,采用容灾和备份手段。并可缩短备份的频次,当数据丢失事故发生时,尽可能地减少丢失的数据量。
鹏云网路ZettaStor还提供完善的数据备份和容灾方案:
1. 性能无损的快照功能,可以数据备份到外部系统,用于站点内数据的快速恢复。
- 2. 提供同/异复制功能,可以把数据同步到异地站点,用于主站发生灾难时的数据保护。
- 3. ZettaStor还天然支持双活数据中心
同/异步复制
双活站点
公有云事件屡次发生,给广大的云用户带来更深层次的思考。公有云到底安不安全?怎么去评价一个公有云是否安全?公有云厂家怎么向用户证明和保证你承诺的安全性?关键业务选择私有云还是公有云?
小编认为如果你选择了一个技术和运维流程都不透明的公有云,即使承诺你100个9的数据可靠性,你会相信吗?特定阶段、特定场合内,数据的可靠性还得靠自己保证。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.