近期腾讯云因为物理硬盘固件版本Bug导致的静默错误,致使互联网创业公司“前沿数控技术”的线上数据丢失事件引起了广泛关注。尽管腾讯云方面称搭载了云硬盘提供三副本存储策略,高达99.99999%的数据可靠性,但是此次事件还是让企业用户产生了云计算到底安不安全的顾虑。
不仅是腾讯云出现故障,近期很多国内国外的云计算平台都发生了故障事件。回顾云计算近期事件,都是小几率事件导致了平台故障,进而导致用户受损,不过客户事故无小事。以下是近期出现云故障事件盘点:
7月24日,腾讯云广州区域部分用户出现资源访问失败、控制台登录异常等情况。经排查,是因腾讯云广州一区的主备两条运营商网络链路同时中断所导致。实际上主备两条运营商网络链路同时被挖断并不常见。
6月27日,阿里云出现运维失误,导致一些客户访问阿里云官网控制台和使用部分产品功能出现问题。受影响范围包括阿里云官网控制台,以及MQ、NAS、OSS等产品功能。据悉这次故障被阿里云内部定义为S1级别(在阿里巴巴的线上业务故障级别中,对S1的定义是:核心业务重要功能不可用,影响部分用户,造成一定损失)。
6月15日,因重复分配内部IP地址,谷歌云虚拟机实例大量出现联不上网的问题。
4月6日,微软Office 365 和 Azure Active Directory访问出现问题......
这些安全事故有出现在运维层面,有出现在产品层面,有出现在网络攻击方面,还有出现在物理设施故障(如容灾)层面。应该说绝对安全的云并不存在,在上云成为既定趋势下,行业客户了解各家云计算厂商如何做云计算安全,应该说有助于在选择云计算厂商时更有思考余地。
AWS:
AWS提出安全责任共担模型,集合AWS、AWS客户、APN合作伙伴三方共同做客户的安全。其中,AWS管理和控制云服务所在的物理设施安全,以及托管操作系统和虚拟层的安全,并构建安全的应用。APN合作伙伴提供涵盖网络安全、配置管理、访问控制和数据加密的工具服务。
另外AWS在2017年末推出了智能安全服务GuardDuty,打造主动检测和持续性防护能力。
在容灾方面,AWS每个可用区具有独立的电源、冷却和物理安全性,并通过运营商的高速光纤网络连接到国家骨干网络。AWS客户可以将其应用程序构建在多个可用区运行,或在两个AWS中国区域分别运行以实现更高的容错。
阿里云:
阿里云同样提出了安全责任共担模型,阿里云负责云平台基础安全防护,用户负责虚拟化层以上的组件安全、业务安全等。阿里云为用户提供了安全管理、系统安全、业务及内容安全三方面安全能力。安全管理包括云账号安全管理及访问控制、安全审计和远程运维,它们大多源于云产品本身的安全功能;系统安全包括了网络安全、主机安全、应用安全、数据安全、安全态势感知等多方面安全服务。
阿里云最知名的安全产品是云盾,云盾在DDoS攻击、OWASP常见攻击都有很好的防御效果,不过在今年3月份的史上首个核弹级DDoS攻击面前,很多阿里云盾的免费用户都遭受了攻击。
类似AWS,阿里云也在态势感知方面努力,利用机器学习和威胁情报发现潜在的入侵和高隐蔽性攻击,回溯攻击历史,预测即将发生的安全事件。
腾讯云:
腾讯云是基于“云管端”的体系做安全,腾讯云在数据安全、网络安全、主机安全、安全服务、风控安全、流量安全、内容安全、终端安全的能力方面正在形成布局;同时,腾讯云已联手100多家生态伙伴联防联控,为用户提供云上防御产品和解决方案。
另一重要消息是,5月29日,腾讯宣布腾讯贵安七星数据中心正式开启一期试运行。未来贵安七星数据中心将被用于存储腾讯最核心的大数据。按照规划,这将是一座绿色灾备数据中心,会存放30万台服务器。应该说这一数据中心的逐步启用,将有助于数据安全。
金山云:
金山云从漏洞对抗、业务安全对抗、虚拟化安全对抗和DDoS对抗四个维度来进行布局,希望形成智能的安全平台和可视化的风险数据预警体系。
金山云通过提供系统补丁、更新yum源等服务,建立自定义安全组拒绝非信任来源的访问请求,提防系统漏洞带来的黑产入侵。
在业务安全对抗方面,主要包括恶意刷单对抗和帐号安全防护。
在虚拟化安全对抗方面,金山云通过主机层隔离、租户内网络隔离、租户间网络隔、主机监控和网络监控等方式,来应对虚拟化安全问题。
针对用户数据的存储,金山云提供包括对象存储、关系型数据库、Redis数据库等多种存储方式,并加持安全隔离、加密存储、访问控制、隐私保护、数据监控等技术手段保证数据安全。
另外结合此前推出的同区域多可用区部署和跨区域VPC对等连接服务,金山云如今可为用户提供同机房、同城、异地三级服务容灾部署能力,为企业级客户打造云上灾备解决方案。
青云QingCloud:
青云QingCloud组建了网络安全、数据安全、账号安全、高可用的系统架构、应用安全及攻击防范等多方面安全防护。青云QingCloud提供块设备级(block device level)的硬盘备份与恢复, 可以同时对多张硬盘做备份(包括系统盘和数据盘),也可以对正在运行的主机做在线备份。
值得一提的是青云QingCloud 在基础网络之外,还提供了私有网络(VxNet)功能。私有网络类似物理世界中的局域网,可保障在公有云多租户的场景下,用户之间100%的二层隔离,这是青云QingCloud在网络安全的布局。
如何做好云安全?企业除了需要考察厂商的整体云安全体系是否完善、强大外,也要考察云厂商是否真正落地三副本存储、同城双活这些措施。同时使用云计算的企业可以考虑将业务部署在多云上,也是防止单一云计算平台出现故障时,导致业务完全中断。生产数据本地备份也十分关键,本次腾讯云故障引起的数据丢失事件中,如果“前沿数控技术”做快照、或者多机备份、或者业务部署在多可用区,也是可以恢复数据的。
另外针对中心化存储的数据丢失这类事故,我们也看到一些行业专家提出的技术解决方案。比如Lambda的创始人何晓阳认为基于区块链技术的Lambda存储,具有去中心化、可证明的持有性和可恢复性、可证明的删除及遗忘、数据流向清晰等特点,尽管当下还存在成本高、技术落地难,但可能是未来数据存储的发展方向。