《我的世界》上线已有十年之久,作为一款沙盒游戏,它以探索、采集、合成和建造等高自由度的操作而闻名,可谓经典不衰。近日,有一群 AI 大佬在里头整了一个大活——他们利用一千多个 AI 智能体,在这一沙盒世界中模拟出了一整套文明体系。
这一计划名为“Project Sid”,最初被公布于今年 9 月,由其主创之一的 Robert Yang 发布在 X 上。在当时的演示视频中,这些由一个个 AI 智能体扮演的游戏 NPC,不仅可以胜任采集、合成等等基础操作,还可以通过相互交流、协作,共同构建经济、文化乃至宗教和政府。甚至还形象地模拟了川普与哈里斯的选票对决,以及贿赂、胁迫等等高度人性化的操作,令人乍舌。眼看着“我的世界”演化为了“西部世界”,你是否会对其背后的原理产生好奇?
10 月 31 日,研究团队在 arxiv 上公开了该项目的技术报告,详细阐述了 Project Sid 的技术核心——简称为 PIANO(Parallel Information Aggregation via Neural Orchestration),也即“并行信息聚合神经协调”架构。在 PIANO 架构中最为关键的,是两种基于人类大脑神经启发的设计概念——“高度并发”和“信息瓶颈”。
先来说“高度并发”。为了实现类似人脑的“高度并发”,团队为智能体设计了 10 个可以同时运行的不同模块,包括记忆、行动意识、目标生成、社交意识和对话,等等。由此,智能体可以在同一时间并行运作多个模块,既能够处理慢速的内部思考(如自我反思或规划),也能够迅速对外部情况做出反应。总之,这些智能体可以像人类一样同时进行思考和行动。
当然,这也会带来一个显著的问题——当多个模块都可以与环境进行交互时,它们的行为可能就会不一致了。就好比一个人的大脑宕了机,他的眼睛看向左边,脚却非要往右走,同时两只手还纠缠在一起掐架,这可乱套了。为了让智能体能够连贯一致地运行,研究团队引入了认知控制器(Cognitive Controller)作为核心模块来实现“信息瓶颈”——可以整合来自智能体各个模块的信息,并做出高层决策,然后将这些决策广播到其他模块,以产生一致的输出。就好像人类的大脑和脊髓那样,时刻接收、整合各个器官传递过来的信息,并系统指导身体行动。
有了这两个概念,PIANO 架构终于可以像它的名字那般,“如同钢琴家演奏钢琴(piano)一样协调音符创造声音,能够选择性地同时并行执行各种模块,使智能体实时与环境交互。”
关于“Project Sid”的下一步计划,Robert Yang 在 X 上发文称将打造一个“超过一千亿智能体规模的世界”。一千亿啊,这一数字已经远远超过了现实中的人类总数,实在难以想象那样规模的数字世界在成型之后,会产生怎样的演变。
水熊虫,学名“缓步动物”,是一种身长不足 1 毫米,却可以耐受超强辐射、高温、高压、低温、干燥等多种极端环境的动物,以其强悍的生命力而闻名。那为什么水熊虫如此强悍?人类是否可以跟它学习几招呢?10 月 25 日,发表于《科学》期刊的一篇文章为我们揭示了“水熊虫”耐受超强辐射的关键机制。
来自中国国家蛋白质科学中心、陕西学前师范学院等多家机构和院校的研究团队,对 2018 年在河南省伏牛山发现的新品种高生属水熊虫物种——河南高生熊虫(Hypsibius henanensis)进行培养、研究,绘制了其高质量基因组图谱,揭示了河南高生熊虫耐受超强辐射的三类机制。
第一类是从细菌、真菌、植物水平转移到水熊虫的外来基因,赋予了其特殊的抗逆能力,如生成甜菜碱色素(betalains)进而清除活性氧;第二类是水熊虫特有的无序蛋白,可以通过相分离促进 DNA 的损伤修复;第三类是水熊虫与其他门类共有的某些非特异性基因,同样可以在辐照后增强 NAD+ 再生并促进 DNA 修复。
这三类机制的突破性发现,在医学生物修复以及宇航探索中应对超强辐射损害等多个领域,都有重要的应用前景。让我们以水熊虫为师吧。
大语言模型与搜索引擎更配吗?近日,多家主流的 AI 产品都有了新动作,不约而同地都和搜索引擎有关。
10 月 31 日,OpenAI 在官网宣布正式推出了“ChatGPT search”,为其旗舰产品 ChatGPT 新增了联网搜索功能,可以根据用户的要求自动搜索网络——这一发布并不算意料之外,毕竟早在今年 7 月,OpenAI 就曾发布过带有联网搜索功能的原型产品“SearchGPT Prototype”。但令人感到玩味的,是这一次新功能上线的发布时机,像在和谷歌打擂台。
因为就在同日的早些时候,谷歌刚刚官宣将为其 AI 平台 Gemini 的 API 接口整合谷歌搜索功能,使该模型能够实时访问来自谷歌搜索的最新信息。最大的区别在于,谷歌的新功能主要面向正在开发 AI 应用程序的专业人员,而 OpenAI 则是面向更为广泛的消费者群体——而就在后者宣布以后,谷歌的股价也应声下跌,至当日收盘时下跌了约 1.96%。
其实,AI 与搜索引擎的结合早就不新鲜了,这一赛道的竞争实际已相当激烈。当前市面上已有的AI搜索产品可以被笼统分为三大类:第一类是专门的AI搜索产品,就像 Perplexity 和此前曾报道过的秘塔 AI 等等;第二类是传统搜索引擎推出的具备 AI 能力的产品,以微软的 New Bing 为代表;第三类则是大模型厂商推出的带有搜索功能的 AI 产品,如国内的 Kimi、豆包等等。而此次谷歌与 OpenAI 的接连入局,无疑为这一领域增添了更多变数。
除了上述这些之外,还有更多的 AI 搜索引擎正在赶来的路上。据 The Information 报道,Meta 也正在开发一款属于自己的 AI 搜索引擎,以期减少对谷歌和微软的依赖。
质数,又称“素数”,关于它的概念,想必大家一定不会陌生,也能随口说出一长串,2、3、5、7、11……那么,迄今为止发现的最大质数究竟有多大呢?
10 月 19 日,“最大质数”的记录被刷新了。据“互联网梅森素数大搜索”网站 GIMPS 于10 月 21 日刊文认证,前英伟达工程师卢克·杜兰特用软件证明了有史以来最大的质数——它有着 41,024,320 位数字,比 GIMPS 近 6 年前发现的已知最大质数多出了 1600 多万位。而且,这也是迄今为止发现的最大“梅森素数”。
“梅森素数”是什么呢?它是质数中的一类特例,凡是符合“2 的 n 次方-1”这一数学式的质数,便是“梅森素数”。此外,如果“2 的 n 次方-1”是一个质数,即它是一个梅森素数,那么在数学式中 2 的指数 n,同样会是一个质数。
而本次发现的最大“梅森素数”,也可以被写为“2 的 136,279,841 次方-1”,因此,这一数字的编号便被定为了“M136,279,841”——而它,也仅仅只是人类发现的第 52 个“梅森素数”。
值得一提的是,此次记录刷新的背后,离不开现代技术与高端硬件的支持。据 GIMPS 称,杜兰特的此次成就,是首次通过专业级的 GPU(显卡)运算来实现的——他所使用的“超级计算机”包括了数千个 GPU 服务器,分布在 17 个国家的 24 个数据中心区域。
看来同样是显卡运算,有些人只会拿来挖矿,而有些人则会用来支撑自己向“无限”不懈探求的热爱。
同样是数学领域,10 月 29 日,著名数学家陶哲轩在其博客转发并推荐了一篇论文。该论文刊载于当日的《美国数学月刊》,探讨的是一则连初中生都耳熟能详的平面几何基本定理——“勾股定理”的证明方式。
而且,这篇论文的内容并不深奥,其内容也并未超出任何一名高中生所应该掌握的学习程度,甚至许多同学都可以毫无压力地按照这篇文章的说明和计算,跟随作者的思路一路推导下来。原因很简单,它的两位作者正是来自美国新奥尔良的两名高中女生。
那为什么一篇勾股定理的证明,能登上专业的数学期刊,还得到数学大佬的推荐呢?
其实,勾股定理已有数千年的历史,关于它的证明方式更是多种多样,远超数百种。而此次由两位高中生提出的新证明,却在圈内引起了不小的关注,因为她们突破性地采用了“三角学”这一数学分支来进行证明——以前人们觉得这种方法是不可能的,因为很容易就会导致所谓的“循环论证”(circular reasoning),即在证明过程中偷用了待证的结果。
然而,此次她们在论文中所提出的 5 到 10 种新证明方法,却得到了陶哲轩的基本认可,同时给出了颇为肯定的评价:“这是一篇有趣的论文,它提醒了我们,即使是数学中最古老、最完善的基础结果,有时也可以从一个全新的角度重新审视。”
看来在大佬的眼中,相较于竞赛、奖项或是满黑板深奥难解的数学符号,更重要的是一颗对数学充满热爱并愿意切实钻研的心。
论文链接:
https://www.tandfonline.com/doi/full/10.1080/00029890.2024.2370240#d1e111