亚马逊AWS解释故障原因并提出解决措施
12月13日消息,据CNBC报道,上周五,亚马逊网络服务公司发布了本月早些时候发生的长达数小时的故障的解释,此重大故障是在网络设备过载后开始的,该故障扰乱了其零售业务和第三方在线服务。该公司还表示计划对其状态页面进行修改。
该公司表示,亚马逊在弗吉尼亚州的大型数据中心US-East-1区域的问题是在美国东部时间周二上午10点30分开始的。
该公司在其网站上的一篇文章中写道:“为扩大托管在AWS主网络中的一项AWS服务的容量而进行的自动化活动,引发了内部网络内大量客户的意外行为。”结果,连接亚马逊内部网络和AWS网络的设备变得过载。
一些AWS工具受到了影响,包括提供虚拟服务器容量的EC2服务。AWS的工程师努力解决这些问题,并在接下来的几个小时内恢复了服务。EventBridge服务可以帮助软件开发人员建立应用程序,对某些活动做出反应,但直到美东时间晚上9点40分才完全恢复。
AWS就此次故障对其客户造成的影响表示歉意。
据了解,此次故障使得热门网站和大量使用的服务都被中断,包括Disney+、Netflix和Ticketmaster。Roomba吸尘器、亚马逊的Ring安全摄像头和其他互联网连接的设备,如智能猫砂盒和应用程序连接的吊扇也因故障而被关闭。
亚马逊自己的零售业务在美国的一些地区也陷入停滞。亚马逊的仓库和送货人员使用的内部应用程序依赖于AWS,因此在周二的大部分时间里,员工无法扫描包裹或访问送货路线。第三方卖家也无法访问用于管理客户订单的网站。
此外,客户在中断期间有七个小时无法创建支持案例。
AWS表示,我们预计在明年初发布新版本的服务健康仪表盘,这将使我们更容易了解服务的影响,以及一个新的支持系统架构,该架构在多个AWS地区积极运行,以确保我们在与客户沟通时不会出现延误。
据了解,上周,亚马逊云计算服务的相关状态页面发布了一则通知,称平台在一些应用编程接口(API)和云计算“管理控制台”功能上出现了故障。这些故障主要影响到亚马逊云计算服务的“美国东部1区”,数据中心位于弗吉尼亚州北部。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn