元宇宙的泡沫:服务器问题未解决

发表时间: 2021-12-13 09:37

电子发烧友网报道(文/黄山明)近日,据外媒报道,亚马逊云服务(AWS)发生宕机事故,导致大面积网站、服务和应用程序瘫痪,直接后果是造成亚马逊电商业务交付混乱、货物堆积。而这也不是今年亚马逊第一次发生服务器宕机事故。


据了解,此次AWS的宕机对于亚马逊配送业务造成严重影响,导致许多司机无法获得配送路线,无法为用户配送快递。同时,使用AWS的众多厂商也受到了影响,如Facebook、迪士尼+、Netflix、任天堂等。


不安分的服务器


就在美国时间12月7日,AWS出现宕机,导致旗下的Prime Music、Prime Video、Alexa在内的大量网站和APP无法正常访问,也让许多使用AWS云服务的企业蒙受损失。


如任天堂便在12月8日凌晨宣布旗下Switch网络服务大规模瘫痪,推测主要原因可能是与导入AWS云服务有关。尽管亚马逊方面迅速进行了抢修,但是此次事故仍然给亚马逊云服务带来了不小的损失。


据相关报告统计,此次AWS云服务器故障导致亚马逊带来的损失或将超过1800万美元(折合人民币1.14亿)。并且这也不是亚马逊今年第一次出现服务器宕机,今年的7月份以及10月份都已经出现过服务网络中断的问题。


当然,服务器宕机的情况并不是亚马逊专属,中国的许多企业便经历过服务器宕机事故。2019年3月份,阿里云出现大规模宕机故障,影响了数量众多的华北地区互联网公司,故障原因是IO Hang(即因为IO错误造成的IO路径阻塞,导致数据拷贝异常缓慢),最终也对阿里云造成了较大的经济损失。


华为云在2020年4月份其位于北京区的云服务器发生宕机,花费了近三个小时才得以恢复,也对相关用户及厂商造成了一定影响。此外,今年7月份,包括B站、豆瓣、晋江等多家大型网站都发生了宕机,导致许多用户无法正常登录浏览网页。


宕机是如何产生的?


所谓宕机即英文直译过来的“down机”,通常指网站、游戏或者网络应用服务器处于非正常运行的状态,服务器处于假死、停止使用或者关闭导致无法正常运行,都能称为宕机。


宕机的产生通常有三个原因,一个是由管理人员主动将服务器重启,用于更新维护;第二个是非主动重启所造成的意外,如供电不足、震动、硬件质量、资源冲突、系统文件损坏、病毒等等;第三是用户访问量过大,导致资源耗尽,数据溢出从而宕机。


当然,理论上来说,访问量大并不会造成宕机,不过当服务器内存满了、CPU性能不足无法处理庞大数据,都会导致信息处理速度变慢,或者拒绝新的服务请求。简而言之,配置过低,加钱就能解决。


另一方面,与个人PC不同的地方在于,服务器基本上全年365天都不会关机,这就导致服务器宕机几乎成为必然。


并且在现实生活中,服务器宕机的情况会更加复杂。通常如今云服务器会有多个节点做负载分散,这样一来哪怕是其他节点都死机,只有一个节点能够工作也不会导致服务器的完全宕机。


如果是在普通情况下的确可行,但是万一遇到一波大量数据来袭,导致其中几个节点暂时性负荷变高,反应速度变慢,那么接下来短时间的所有流量都会被导入剩余的节点当中,导致剩余的节点很难处理过量的数据,最终导致服务器宕机。


也就是说,本来许多所有节点共同参与才能完成的工作,其中有几个节点率先阵亡,导致剩下的节点压力飙升,完蛋是迟早的事。


解决宕机问题,是实现元宇宙的关键


已经明白了宕机如何产生,那么解决服务器宕机的方法通常有两个,一个是及时发现服务器宕机的问题,尽快修复,避免不必要的损失,例如在负载节点还能支持的时候解决这一问题;另一个则是额外准备一个备用服务器,存放的内容相同,但IP不同,并且机房的地理位置也不同,这样发现宕机后能够迅速修改服务器域名,切换至备用服务器解决问题。


但有了解决方案却并不意味着所有的问题都能解决,比如最容易让服务器发生宕机的情况就是访问量数据突然过大,导致服务器无法及时处理导致崩溃。而目前讨论火热的元宇宙,将对云服务器提出更为严峻的挑战。


举个例子,近十数年来双十一都是用户网络购物狂欢的节日,但过去许多用户发现,在双十一当晚零点购物支付时,会发生卡顿或者无法弹出相关界面的问题,就是因为访问量数据突然增大,导致后台服务器无法处理造成系统卡顿的情况。


如今双十一的购物卡顿减少,也是因为阿里提前从外界租了许多服务器为了应对这一局面,而平常并没有这么多服务器来维持运行。


如果元宇宙成真,那么支撑元宇宙的服务器或许将每时每刻都要面临超过双十一数千倍甚至上万倍的访问量,更何况元宇宙中的数据更为复杂,处理时需要的资源也更多。


海量的数据意味着海量的服务器,其背后的成本也将不是某个企业甚至某个国家能够单独完成的。如果还需要准备备用服务器,那么成本更是一个天文数字。


但宕机问题也是元宇宙必须要面对的,想要当做人类的第二世界,如果经常发生卡顿、数据无法访问的情况,那么这个游戏永远也无法被称为元宇宙。