ChatGPT近8小时大规模宕机事件解析

发表时间: 2024-06-05 11:39

美东时间6月4日(周二)下午,OpenAI的旗舰聊天机器人ChatGPT(包括网站、APP和桌面应用)出现系统故障,导致全球数百万用户无法正常使用,持续长达近8个小时。

OpenAI在其官网上证实了此次系统宕机,称“我们经历了一次严重的服务中断,影响了所有的ChatGPT用户,但受影响的不包括platform.openai.com或API。”这意味着依赖OpenAI技术的第三方服务未受到影响。但OpenAI官方尚未公开具体的故障原因。

ChatGPT中断期间,大量用户转向Anthropic公司的Claude、谷歌Gemini和Perplexity等替代工具。其中,谷歌AI聊天机器人Gemini的搜索量激增至327058次,较5月4日至6月3日期间的204991次日均搜索量增长近60%。

然而,在流量激增之下,上述三大AI平台也遭遇了系统瘫痪,不过这些问题在几小时内迅速得到了解决。

对于此次AI服务器集体“罢工”的原因,有网友在X平台上发出疑问,“这是由于DDoS(分布式拒绝服务攻击)还是巧合?”还有网友表示这就像多米诺骨牌效应,一家公司算力不够导致其他公司访问量激增,从而集体瘫痪。

ChatGPT一天宕机两次,谷歌Gemini搜索量激增近60%

ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。美东时间周二下午,ChatGPT(包括网站、APP和桌面应用)出现系统故障。当时,在ChatGPT的主页面,提交按钮显示为灰色,用户无法给AI聊天机器人发送消息。随后,ChatGPT网站表示,服务已经满负荷,会在恢复服务时通知用户。

图片来源:OpenAI

值得注意的是,ChatGPT在当天共发生了两次故障,首次故障出现在当日凌晨2点半左右,早上7点半左右OpenAI宣布故障已解决。然而,当日上午10点半左右,OpenAI报告正在调查第二次故障的原因,最终于美东时间当日下午1点左右,OpenAI宣布所有系统已恢复正常运行。也就是说,ChatGPT两次的宕机总时长近8个小时。

OpenAI的状态页面显示,该公司在过去90天内发生了十几次中断,但通常在不到一个小时的时间内就得到了解决,周二的故障是最严重的一次。

过去24小时内提交的关于OpenAI宕机的问题报告 图片来源:Downdetector

ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。想象一下,在产品发布或客户支持危机期间失去对关键工具的访问权。这可能是毁灭性的!不要把所有的鸡蛋都放在一个篮子里,无论这个篮子有多大。”

图片来源:X

据软件公司QRFY分析,在ChatGPT中断期间,谷歌AI聊天机器人Gemini的搜索量激增至327058次,较5月4日至6月3日期间的204991次日均搜索量增长近60%。该公司表示,“Microsoft Copilot”的搜索量也有所增长,但不如 Gemini的搜索量增长那么显著。

QRFY 首席执行官Marc Porcar指出,“ChatGPT中断和Gemini搜索量激增之间存在明显的平行趋势,这一事实表明人们认为 Gemini是ChatGPT的明显替代品。”他补充说,“在ChatGPT缺席的情况下,人们显然转向了Gemini。”

Gemini、Claude和Perplexity也集体“罢工”

然而,在流量的激增之下,Gemini、Claude和Perplexity也都遭遇了系统瘫痪,不过这些问题在几小时内迅速得到了解决。

瘫痪期间,Claude网站持续显示一条提示信息:“服务器组件渲染时出现错误”,提醒用户系统正在处理中。据悉,北京时间凌晨12:10之后,Claude重新正常工作。

Perplexity网站因为接收到太多请求,一度显示超出服务容量的信息,Perplexity提示用户:“我们很快回来”“我们现在收到很多问题,已经达到我们的处理能力,请稍后再来。”Claude恢复正常工作后不久,Perplexity的网站也重新开始正常服务了。

对于此次AI服务器集体“罢工”的原因,有网友在X平台上发出疑问,“这是由于DDoS(分布式拒绝服务攻击)还是巧合?”还有网友表示这就像多米诺骨牌效应,一家公司算力不够导致其他公司访问量激增,从而集体瘫痪。

The Register报道称,根据受影响的用户的说法,宕机后ChatGPT无法响应用户的查询,这表明问题可能出在服务端的某个地方。当用户要求ChatGPT进行自我诊断时,其给出了一个简洁的回答——“内部服务器错误”。

《》记者注意到,ChatGPT在2023年11月8日也曾遭遇宕机事件,持续时间超过2小时。起初,OpenAI的CEO阿尔特曼将服务器不稳定归咎于OpenAI使用量“远超预期”,这也是外界的普遍解读,但当OpenAI及时修复了ChatGPT中断之后,才发现这个解释并不全面。

经过调查,OpenAI官方认为,当时ChatGPT和API遭遇的重大故障是由网络攻击造成的,这种攻击疑似为DDoS,一个黑客组织已宣称对此负责。

DDoS是网络攻击的一种,旨在消耗殆尽系统资源,使其无法回应服务请求。这种攻击由攻击者控制的大量受恶意软件感染的主机发起。DDoS之所以命名为“拒绝服务”,是因为会最终导致受害网站无法为用户提供服务,“分布式”则是指攻击的发出点分布在不同地方,攻击者可以有多个。

网络安全厂商StormWall的报告显示,2023年以来,DDoS攻击威胁不断升级,攻击量,强度和持续时间也显著增长。

对于这类问题带来的管理责任,监测机构victoria ametrics的联合创始人Roman Khavronenko在X平台上发文称:“病毒式传播已经不再罕见,但能够处理病毒式传播流量的网站仍然太少了。如果数据是现代企业的命脉,为什么它仍然没有得到妥善管理?”

原标题:全球数百万用户受影响!ChatGPT遭遇近8小时大规模宕机,谷歌“平替”产品Gemini搜索量激增60%“躺赢”?