当AI能够自主完成科学研究和论文撰写,是否将颠覆人类的科学研究活动?
8月13日,全球首个全自动科学发现AI系统——“AI科学家”(AI Scientist)发布,该系统由日本初创公司Sakana AI与牛津大学、哥伦比亚大学学者合作研发,能够独立完成科学研究的全过程,包括创意生成、代码编写、实验执行、结果总结和论文撰写。
“AI科学家”展示了一个人工智能自主进行研究、总结、审阅、反馈、迭代的全新科研模式。其研究过程包括创意生成、实验迭代、论文撰写和自动化审稿四个阶段。
创意生成阶段,系统基于现有主题的起始代码模板进行头脑风暴,并在语义学者数据库(Semantic Scholar)中搜索以确保原创性。
实验迭代过程中,系统自主编写代码、执行实验,并制作可视化图表,对结果进行分析。
论文撰写阶段,系统按照标准机器学习会议论文的风格,以LaTeX格式(一种排版方式,适合于生成包含复杂数学公式、图表、参考文献和具有严格的格式要求的学术和技术文档)撰写进展报告,还会自主使用语义学者数据库(Semantic Scholar)搜索并引用相关文献。
更为关键的是自动化论文评审环节,Sakana AI 开发了自动审稿人系统,能够以接近人类的准确度评估生成的论文。生成的评审意见既可用于改进项目,也可作为对后续构思的反馈。这意味着,可形成持续的反馈循环,实现了一个闭环的科研生态系统。
在这样一套全自动科研体系下,“AI科学家”可以在一周内产生数百篇中等质量的论文。根据自动审稿系统的评估,个别论文质量甚至可达顶级机器学习会议的接受门槛。
“AI科学家”主要应用于机器学习研究,已在扩散建模、Transformer建模和神经网络学习动态等领域有所贡献。目前,它每篇论文的生成成本可控制在15美元以下,而且能以7×24小时开展科研活动,未来也有可能应用到机器学习研究之外的领域。
尽管仍存在无法处理视觉信息、与基线不公平比较、产生幻觉等局限性,“AI科学家”生成的论文可以提供广泛的信息和创新性,或至少包含未来研究的潜在价值。
更重要的是,这套完全由 AI 驱动的科学生态系统,已全部开源。(开源地址:
https://github.com/SakanaAI/AI-Scientist)
值得一提的是,Sakana AI 成立于2023年7月,由前谷歌研究人员David Ha和Llion Jones联合创办,2024年6月获得1亿美元A轮融资,是日本AI独角兽企业,目前公司估值超过11亿美元。
人类科学家们,准备好迎接“AI科研”的新时代了吗?
8月13日,美国初创公司MultiOn发布智能体Agent Q,它结合了引导式蒙特卡洛树搜索(MCTS,一种用于决策过程的搜索算法)、AI自我批评和直接偏好优化(DPO,一种离线环境的强化学习方法,适合多步推理问题)等技术,拥有规划、推理能力和自我修复功能。在Open Table(一个餐厅预订网站)的真实预订任务中,Agent Q用一天的训练时间就将Llama 3的零样本性能提升了340%,在真实世界的预订任务中获得95.4%的成功率。
OpenTable上不同方法的成功率。图片来源:MultiOn
MultiOn成立于2023年,由迪夫·加格(Div Garg)和奥马尔·沙亚(Omar Shaya)联合创立,两人均毕业于斯坦福大学,并曾任职多家AI公司。公司已获得Amazon Alexa Fund、Samsung Next、OpenAI等的投资。
• 点评:Al Agent(人工智能体)能够感知环境、进行决策和执行动作,在大模型技术驱动下,让人们以自然语言为交互方式,高自动化地执行和处理专业或繁复的工作任务。Agent Q在上述评估实验中展示了如何在复杂网页环境中实现自主学习和推理,是AI智能体在现实环境中做出复杂而可靠的决策的一大进步。(罗仙仙)
8月15日,美国初创公司Tavus推出面向开发者的视频对话AI模型CVI,这是目前全球响应速度最快的同类技术,延迟时间不到一秒,能够理解语言、观察视觉信息并做出反应,提供沉浸式的视频交互体验。基于自研的Phoenix-2模型,CVI结合了3D模型和2D GANs技术,实现了快速响应和高保真渲染。该技术已被用于Delphi教育平台的数字克隆辅导功能,通过实时视频互动提供个性化的辅导体验。CVI还允许开发者选择数字孪生(digital twins)或标准AI代理(AI Agents),并根据需要定制语言模型、角色、记忆、上下文和场景。
• 点评:从文字到语音,再到视频,人类与AI的交互体验正不断升级。我们相信,数字时代的互动和工作方式具备无限可能。(谯雅馨)
8月12日,美国半导体公司AMD宣布以6.65亿美元(约合人民币47.7亿元)完成对Silo AI的现金收购。Silo AI总部位于芬兰,专注于提供端到端AI驱动的解决方案,是欧洲规模最大的私人AI实验室之一。目前,Silo AI在 AMD 的平台上开发了 Poro 和 Viking 等多个开源多语言大模型。收购后 Silo AI 将并入AMD的AI事业部。
• 点评:这笔交易是Google自2014年以约6亿美元收购英国 DeepMind之后,对欧洲私有AI公司的最大规模收购,也彰显了AMD挑战英伟达市场地位的野心。(谯雅馨)
8月12日,美国FDA批准丹麦生物制药公司Ascendis(ASND.O)研发的长效激素疗法Yorvipath(palopegteriparatide;TransCon PTH)上市,用于治疗成人甲状旁腺功能减退症(HP)。这是首款获FDA批准用于甲状旁腺功能减退激素的替代疗法。
Yorvipath是一种每日一次的长效甲状旁腺激素(PTH)前药,每天给药一次,旨在24小时给药期间持续释放PTH,使PTH恢复至生理水平,以解决该疾病的短期症状和长期并发症。本次获批是基于一项全球临床2期试验和临床3期试验的数据,其中3期临床研究共纳入82例患者,Yorvipath治疗组有78.7%的患者实现不依赖常规治疗、保持血清钙水平在正常范围内(8.3–10.6 mg/dL),在安慰剂组此数值仅有4.8%。
• 点评:甲状旁腺功能减退症是一种内分泌系统疾病,因甲状旁腺无法产生足够的PTH而导致低钙血症和高磷血症,最终可能会出现一系列并发症。钙和维生素补充剂是常规治疗疗法,但无法恢复正常的甲状旁腺激素生理机能,Yorvipath的获批为患者提供了更多治疗选择。(罗仙仙)
8月13日,美国FDA批准Galderma(高德美)研发的白介素-31(IL-31)受体靶向单抗Nemluvio(nemolizumab)用于治疗成人结节性痒疹(PN)患者,其为预填充笔,用于皮下注射。Nemluvio是首款获美国FDA批准的IL-31单抗药物。
Nemluvio是一种“first-in-class”单克隆抗体,通过特异性抑制IL-31细胞因子信号传导,参与结节性痒疹的炎症、表皮分化改变和纤维化(皮肤组织硬化),最初由中外制药开发,Galderma在2016年获得了除日本和台湾以外全球范围内的独家权利。
• 点评:PN是一种慢性皮肤疾病,其特征是出现硬而极痒的肿块(结节),通常出现在手臂、腿、上背部、腹部等容易抓伤的部位。此前,由再生元和赛诺菲联合开发的Dupixent(度普利尤单抗)在2022年9月获美国FDA批准,为唯一获美国FDA 批准用于治疗PN的药物。Nemluvio通过抑制IL-31的信号通路,能有效地改善瘙痒和皮肤结节,为患者患者提供了新的治疗选择。(罗仙仙)
8月14日,美国FDA加速批准吉利德科学(Gilead Sciences)研发的新药Livdelzi(seladelpar)与熊去氧胆酸(UDCA)联合用于治疗对UDCA应答不足的原发性胆汁性肝硬化(PBC)成人患者,或作为单药治疗对UDCA不耐受的患者,但不建议患有或发展为失代偿性肝硬化的患者使用Livdelzi。该药是在碱性磷酸酶(ALP)正常化、关键生物标志物和瘙痒控制方面,与安慰剂相比表现出统计学显著改善的首个疗法。
Livdelzi是一款口服的强效选择性过氧化物酶体增殖物活化受体δ(PPAR δ,能调节关键的代谢和肝病途径)激动剂,原由CymaBay开发,2024年2月吉利德以43亿美元收购CymaBay获得该产品。
• 点评:PBC是一种主要影响40岁以上女性的罕见慢性自身免疫性胆管疾病,由于免疫系统持续攻击胆管,胆汁流动受阻而淤积,毒性胆汁酸在肝内留存,可发展为肝纤维化、肝硬化和肝功能衰竭。目前尚无治愈PBC的方法。从临床数据看,Livdelzi可让肝脏复合改善,此次获批不仅丰富了吉利德肝病产品组合,也为PBC患者带来新的治疗选择。(罗仙仙)
8月14日,中国科学院金属研究所在《自然》发表论文A hot-emitter transistor based on stimulated emission of heated carriers,报告了一种新型“热发射极”晶体管。该晶体管由石墨烯和锗等混合维度材料构成,采用了两个耦合的“石墨烯/锗”肖特基结设计,实现了对载流子的“受激发射”控制——载流子由石墨烯基极注入,随后扩散到发射极,并激发出受电场加热的载流子,从而导致电流急剧增加。与传统晶体管相比,这款新型晶体管在亚阈值摆幅上实现了显著的降低,低于1 mV/dec,打破了传统晶体管60 mV/dec的玻尔兹曼极限,同时在室温下展现出超过100的峰谷电流比和负微分电阻特性。
• 点评:该研究通过可控调制热载流子来提高电流密度,为晶体管器件研究领域带来了创新思路和技术突破,也为多值逻辑计算和低功耗集成电路的应用提供了新的方向。(谯雅馨)
8月12日,复旦大学周鹏、刘春森团队在《自然-电子学》发表论文A scalable integration process for ultrafast two-dimensional flash memory,在高速非易失存储技术领域取得重要进展,首次实现了1Kb规模的纳秒级超快闪存阵列集成,并证明了其超快特性可扩展至亚10纳米尺寸。该团队开发的超界面工程技术在规模化二维闪存中实现了原子级平整度的异质界面,集成工艺优于国际水平,良率高达98%,超过了国际半导体技术路线图的要求。此外,团队还研发了一种自对准工艺,成功制造出沟道长度为8纳米的超快闪存器件,突破了硅基闪存的物理尺寸极限。
• 点评:二维超快闪存技术可将非易失闪存的编程速度从微秒级提升至纳秒级,实现千倍以上的速率提升。此次研究实现了该技术的规模集成,将为超快闪存技术的产业化应用提供重要助力。(谯雅馨)
南方周末科创力研究中心
责编 黄金萍