人工智能进化史:从Eliza到AI Agent的“练习时长”揭秘

发表时间: 2024-11-14 17:16

本文来源:时代周报 作者:王夏

编者按:时光的力量滚滚向前,潜移默化,改变世界、改变时代、改变每一个人,不可逆转。11月18日,《时代周报》将迎来十六周岁生日。十六年来,我们以富有穿透力的思想和锐利的新闻事实,用专业视角解读中国资本趋势和产业变革,用工匠精神讲好大国崛起的中国故事,用财经智慧助力高质量发展的中国梦。我们见证着这个伟大的时代,也记录着一个个关于勇敢、热爱、求变的故事。值此十六周年之际,《时代周报》推出“为勇敢作序”特别报道,为勇敢鼓与呼。

“百度的愿景并不是要推出一个‘超级应用’,而是希望不断地帮助更多人、更多企业打造出数以百万‘超级有用’的应用。” 百度CEO李彦宏在近日举行的百度世界大会上表示。

在应用元年,面向不同场景的AI应用正逐渐成为真正的“生产力工具”。在不断升级迭代中,人工智能在B端推动打造“黑灯工厂”“无人农场”,在C端,AI走向手机、电脑等终端,带来更灵活和个性化的操作体验。

人工智能是什么?1956年,约翰·麦卡锡在达特茅斯会议上首次提出人工智能的概念,认为AI是“让机器的行为看起来像是人类的智能行为”。

而能够使用工具,拥有语言和文字交流是人类的重要特征。

1966年,在“人工智能”这个词汇出现10年后,世界上第一个聊天机器人“Eliza”诞生了,通过运行DOCTOR脚本,Eliza能对关键字扫描和重组,与使用者进行简单的对话。

在此后的数十年间,AI技术上也有不少突破,但AI与人类对话的种子最终萌芽于千禧年的第一个十年。

2008年,Google开创性地推出了语音识别APP。在前一年,Siri公司成立了,2010年,苹果正式将之收购,并在之后推出了划时代的语音助手Siri。不过,由于所能实现的功能有限,用户对此的新鲜感也很快过去。

产品不够智能、市场空间不大在此后的十余年一直是笼罩人工智能助手这条赛道的阴云,直到2022年底,ChatGPT横空出世。

AI成为助手的可能性近在眼前。

从“狡猾策略”到对答如流

人工智能如何实现与人类对话,简言之,是一个自然语言处理(NLP)问题,也即,如何让计算机能够理解、生成和处理人类语言。

但解决这个问题并不容易。

Eliza的发明者维森鲍姆采用的方式,是通过“狡猾策略”设计代码,让程序能够像某种类型的心理医生一样,通过倾听病人的陈述、重复病人所说的话并对病人的情感作出反响,来帮助病人表达自己的情感来获得疗愈。

也因此,Eliza并不理解对话者的真实意思,只是根据关键词的组合作出简单的回复,或者是给出类似“请继续”这样引导性的反应。

在此后的数十年间,科技界对此有不少尝试,但并没有实现突破性的进展。

2008年,AI先锋Google推出了语音识别APP,大大提高了语音识别的准确率。2011年,苹果推出语音助手Siri,风头一时无两。

不过在2012年,就有iPhone用户对苹果提起诉讼,认为iPhone 4S语音助手功能Siri并不像电视广告中介绍的那样智能。 “Siri要不是不懂我问的问题,要不就是长时间才会进行响应,而且还给出一个错误答案。”这名用户表示。

直到ChatGPT横空出现,AI这个概念才具象、清晰地浮现在世人的眼前。

5天注册用户突破百万,两个月左右实现用户数破亿,这种飞速增长让人们再次真切地感受到“人机对话”巨大的可能性。

在国内,文心一言、智谱清言、Kimi等大语言模型应用密集发布,迅速抢占市场。IDC在其《中国大模型平台市场份额,2023:大模型元年—初局》中提到,2023年中国大模型平台市场规模达17.65亿元人民币。

人们很快发现,AI能够回答人类的问题背后,还有诸多提升的空间,于是便开始期待能够有更“自动化”的解决方案来提高效率和生活质量。

从“说些什么”到“做些什么”

在即将结束的2024年,应用场景成为AI领域的热点话题。技术飞速前进,让人们对AI的诉求从“说些什么”变成了“做些什么”。

AI Agent取代ChatGPT走到聚光灯下。

什么是AI Agent?OpenAI给出的定义是“以大语言模型为大脑驱动的系统,具备自主理解、感知、规划、记忆和使用工具的能力,能够自动化执行完成复杂任务的系统。”

在深度科技研究院院长张孝荣看来,技术进步和需求升级的推动下,AI Agent概念火热是非常自然的事。

“简单来看,大模型是AI Agent实现的前提和基础。”他指出,ChatGPT类型的产品主要是基于自然语言处理的模型,它们能够通过对话的方式与用户进行交互,完成聊天对话、语言翻译、文本生成、智能客服和虚拟助手等任务。

而AI Agent则更进一步,它们不仅能够进行对话交互,还能根据用户给定的目标自主执行任务,这涉及到更高级的自主性和决策能力。

AI Agent通常需要结合大型语言模型(LLM)、长期记忆、提示工程(Prompt Engineering)以及插件等技术。在技术和应用上,ChatGPT可以视为AI Agent的一个基础组件,AI Agent则是在ChatGPT的基础上增加了更多的自主性和执行能力,使得AI能够更深入地参与到任务的执行中。

10月底,智谱AI发布了AutoGLM,这是一个能代替人在手机和网页上完成各种操作的AI助理。几乎在任何场景下,只需要用户的一句话,手机就能手机自动帮用户点外卖、发微信、写点评、对朋友圈进行评论。

如今,终端能够“自动驾驶”成为人类对AI应用下一个阶段广泛的期待。中信证券则指出,AutoGLM为代表的AI Agent技术有望成为AI终端的亮点功能并吸引消费者升级换代。

在B端,人工智能也在发挥实际作用。《中国AIGC应用全景报告》显示,B端产品已经有80%实现营收。

潜在用户活跃,资本市场闻声而动。

在AutoGLM发布后的几天,包括并行科技、首都在线、创业黑马、豆神教育、传智教育、电广传媒在内的多支“智谱概念股”迅速上涨。

终端侧,已经有厂商开始了行动。同样在10月,荣耀发布了MagicOS 9.0,其亮点之一就是全新升级的YOYO智能体,据荣耀介绍,智能体能够精准理解用户需求、拆解任务步骤,并自主操作、调取手机上各类资源与第三方服务,以满足用户需求。

除了AI手机,AI PC也被认为是未来极具潜力的AI终端之一。Canalys数据显示,2024年第三季度,AI PC出货量达到1330万台,环比增长49%,占本季度PC总出货量的20%,总市场份额提升至53%。

“AI应用的下一步可能会更加注重自主性和个性化。”张孝荣认为,人工智能应用将不仅仅局限于对话和信息处理,而是能够根据用户的具体需求和偏好,提供定制化的服务和解决方案,教育和学习、企业日常运营和创意产业会成为这些应用最先落地的方向。

德邦证券认为,国内AI应用2024Q3业绩迎来拐点,AI新品频出有望提高业绩贡献度。金山办公、科大讯飞、同花顺等9家A股AI应用标的,从2024Q3最新季报来看,合计实现营收89.54亿元,同比增长11%,增速环比提升3.16pct;合计实现归母净利润6.93亿元,同比下降3.32%,而2024Q2同比增速下滑36.32%,Q3增速环比大幅提升33.01pct,认为整体上业绩拐点已现。