OpenAI为何依赖"星际之门"超级计算机?四大理由解析

发表时间: 2024-04-06 16:19

微软为何要为OpenAI打造价值千亿美元的“星际之门”超级计算机?这一问题的答案将揭示未来一到四年内人工智能发展的关键走向。这两天,博主AI Explained和Peplexity创始人、前OpenAI研究员Aravind Srinivas进行了一场讨论,围绕这一超级计算机可能带来的突破性进展以及当前他对AI发展时间线的看法,建设星际之门超级计算机原因主要有四点:

1) 在计算方面赶上谷歌

2) 建立两代以上所需的模型,主要是基于 RL(强化学习) 衍生的合成数据

3) 让模型在决定输出之前思考更长的时间,如果需要的话,可以思考数小时或数天。

4) 不仅要能满足 2028 年所需的全球响应量,还要能以视频等计算量大的模式生成响应

具体关键内容如下:

据报道,这个名为“星际之门”的超级计算机项目计划于2028年左右在美国某处沙漠地带启动,其规模之大令人难以想象。若按国家GDP计算,该数据中心的成本投入足以使其成为全球第64富有的经济体。而在此之前,整个宏大计划的早期部分最早将于今年上线

“星际之门”超级计算机的运算能力相较于目前微软提供给OpenAI的资源将实现最少100倍增长

然而,这一切的前提条件是OpenAI能够实质性地提升其AI技术能力。微软是否推进“星际之门”项目的决心部分取决于OpenAI在这方面能否取得有意义的进步,这很可能与即将在春季推出的GPT-4.5或者许多人期待已久的GPT-5有关

微软构建“星际之门”超级计算机的一个核心原因是支持OpenAI开发更强大的模型,如GPT-7、GPT-8等。当前已有迹象表明,OpenAI极度依赖微软的算力支持来与谷歌等竞争对手保持竞技状态。据内部消息透露,截至2024年第二季度,谷歌在计算能力上已经明显领先于OpenAI,微软CEO更是强调即使OpenAI明天消失,他们也拥有全部知识产权、人才、计算能力、数据等全方位资源,足以与任何对手抗衡

研发基于强化学习的高级模型: 超级计算机的另一项任务是支撑OpenAI开发基于强化学习的下一代模型,这些模型不再单纯依赖于人类数据,而是能利用强化学习方法自我迭代,生成用于训练的合成数据。这种方法有助于打破纯粹模仿学习的局限,让AI模型获得更接近人类智能的自主学习能力和创新解决问题的技能

从讨论中我们可以了解到,未来的AI模型有望通过自动清理互联网数据并训练它们,在生成答案前先进行推理链分析,从而极大地提高可靠性和准确性。这种模型可以在给出答案之前搜索整条思维链条,或扩展为探索多个可能的思维分支,并基于概率找到最合理且深刻的解释,就像围棋或国际象棋选手对多步棋局策略的深度推理那样

在短期内,我们可能会看到一种能够经过长时间思考(比如几个小时)后反馈出极具洞察力结果的API服务。虽然它不会立即响应,但最终返回的是让人眼前一亮的高质量答案,这样的AI服务堪称人类智慧的升华。未来几年内,这类服务可能带来革命性的突破,预计在24个月左右就会有类似成果出现,最迟明年就有可能实现

此外,“星际之门”超级计算机还有一个重要目标:主宰不同的模态处理领域,满足未来需求并应对多种复杂模式生成,要满足在2028年及之后可能出现的全球范围内对高性能AI计算的需求