从幕后到台前:ChatGPT在AI历史中的重要地位

发表时间: 2022-12-13 17:33

文丨吴靖雯(前财经领域资深媒体人,长期关注集成电路、区块链、互金等行业)

12月初,人工智能实验室Open AI发布了一款名为ChatGPT的自然语言生成模型,据官方数据显示,ChatGPT的用户数量在12月5日正式突破100万,这距离它上线仅5天。

除了暴涨的用户数量,ChatGPT也成为了新的流量密码,截至发稿时间,无论是专业媒体还是社交媒体,都充斥着关于ChatGPT的讨论。查阅百度指数、微信指数等几个国内的主流热点趋势指数可知,在过去的两周里,ChatGPT的热度一度超过Alpha GO的峰值。

“AI即将取代人类”这一议题也再次引发了广泛的公共讨论。而在这一系列的讨论里,“AI将取代大量人类工种”、“谷歌即将迎来末路”是最为广泛的观点,AI与人类一较高下的时代似乎正在来临。

ChatGPT凭什么5天吸纳百万用户?

12月5日,ChatGPT的创始人在推特上表示,ChatGPT的用户数量正式突破100万人。

在一定程度上,ChatGPT可以说是自AI概念提出以来,普及度最为广泛的一款AI应用。在社交网站上晒出自己与ChatGPT的对话截图已经成为了一种潮流。但是是什么在背后推动如此多的人开始与ChatGPT进行交互的呢?

分析 ChatGPT的结构可知,它是基于Transformer算法架构开发的一个大型预训练语言模型,能完成包括写代码、创作菜谱、做作业、写小说、创作商业文案等一系列常见的文字输出型任务。Open AI对其对定位为聊天机器人,与其他使用预定义的响应或规则生成文本的聊天机器人不同的是,ChatGPT在经过了大量的数据训练之后,可以根据接收到的输入生成响应,从而生成更自然、更多样化的响应。

可以说,ChatGPT是目前最为先进的聊天机器人,“更为智能的交互”则是ChatGPT之所以能引起全球广泛关注的主要原因。比如Open AI为这个模型新增了代码理解和生成能力,极大地拓宽了其应用场景;同时还加入了道德原则,使ChatGPT能够识别恶意信息,识别后拒绝给出有效回答,有效提升用户对话时的互动感。

1956年夏季,“人工智能”这一术语被正式提出,它标志着“人工智能”科学的正式诞生。此后,IBM公司研发的代号为“深蓝”超级电脑击败了人类的世界国际象棋冠军,更是进一步拓宽了人工智能技术的想象空间。可以说,这门科学在提出伊始就被人类给予了超越人类智慧的野望。

但是自概念提出至今已有六十余年,除了科幻电影中的各种想象之外,普通民众还没有机会能够直接接触到AI技术,也没有合适的渠道对这一深奥的技术进行了解。虽说各个内容平台早已经开始使用智能算法技术进行个性化推荐,线上购物平台也在使用人工智能技术提高广告触达率,但这些应用并没有将用户纳入交互之中,在这一过程中,用户仅仅充当着一个被动接受者的角色。

而ChatGPT的推出为用户提供了一个参与到AI技术工作流程中的机会,也提供了一个途径以使得长期对AI应用不甚了解的用户可以切实地体会AI技术的发展。这在AI的发展历程中具有一定的里程碑意义,意味着AI技术由“幕后”转向了“台前”。

数据缺乏以及高昂成本为AI行业的普遍难题

多方证据表明,在上线不到两周的时间里,ChatGPT的功能就不再只局限于聊天机器人,大量用户开始使用ChatGPT来辅助学习和工作。除了用户反馈之外,ChatGPT的实用价值也得到了资本市场的认可,东吴证券发布研报指出:“总体上,ChatGPT对话效果令人满意,新鲜感与实用价值使其快速走红。”

就目前ChatGPT的智能程度以及AI行业的整体发展水平而言,ChatGPT或许会走上与Alpha Go相似的道路——在引起全民关注后逐渐归于沉寂。早在2016年,谷歌研发的Alpha Go就已经掀起过一波全民AI热潮,但是到目前为止,都还没有基于Alpha Go的成熟AI商业应用产生。

分析目前ChatGPT的应用水平以及智能程度可知,要想取代人类工作者,ChatGPT还有很长一段路。

首先,ChatGPT的完成度以及智能化程度并不足以支撑ChatGPT具备成熟的思考能力并独立完成工作。现今已有大量证据表明,ChatGPT的优势在于组织出看似具有逻辑的且完成度较高的答案,但是却并不能保证答案的真实性以及内在逻辑的准确性,这就造就出了ChatGPT经常性地给出一个看似完美的回答,却与客观事实以及现实逻辑相悖。从这一个角度上来说,ChatGPT要取代人类还需要大量的机器学习以及数据投喂。

其次,目前ChatGPT学习的数据库还停留在2021年,而想获得更广泛的数据许可或将面临着隐私安全、经济、技术等一系列难题。Open AI明确在其官网上表示,由于ChatGPT 没有连接到互联网,它偶尔会产生不正确的答案,“它对 2021 年之后的世界和事件的了解有限,偶尔也可能产生有害指令或有偏见的内容。”

在隐私安全以及数据保护日益严苛的当下,要想获得更广泛且新鲜的数据进行模型训练时,Open AI则会面临一系列的政策风险以及高昂的经济成本。中科院物理所撰文表明,由于巨大的参数数目以及训练所需数据集规模,训练一个GPT-3模型保守估计需要五百万美元至两千万美元不等——如果用于训练的GPU越多,成本越高,时间越短,反之亦然。

而如何低成本且安全的获得海量数据用于机器学习也是目前AI行业在发展时所面临的普遍问题。针对这一问题,业界也有部分人士提出隐私计算、区块链等解决方案,但在技术成熟度上来看,这些技术都不能从根本上解决问题。

ChatGPT的目标不是取代人类

分析目前中国的AI行业可知,已实现落地的产品高度集中在To B行业,例如智能算法推荐、智慧城市、智能监控等。除去可以利用自有平台的海量用户数据不断优化模型的智能算法推荐之外,无论是智慧城市还是智能监控对于数据层的要求都相对较低,其核心在于大算力。

而ChatGPT的发展方向与以上几种类型均不相同。目前部分人士认为ChatGPT的出现将挤占搜索引擎的生存空间,随着以ChatGPT为代表的智能语言生成模型的发展,搜索引擎将成为过去式。

分析搜索引擎以及ChatGPT的模式可知,取代之说有失偏颇:搜索引擎在于海量数据的聚合,而ChatGPT在于基于交互的文本输出,两者的功能存在明显差异。但是搜索引擎却不失为ChatGPT的一个发展方向。

随着带宽以及智能设备的增加,线上数据规模呈几何倍增,这无论是对个人还是企业均提出了巨大挑战,我们要如何在海量数据中寻找出对自己有价值的信息?以及企业又应该如何基于海量数据做出合理的决策?

在不能人人成为数据科学家的背景下,拥有处理海量信息能力、输出完整文本并进一步依照指令进行结果修正的ChatGPT成为了一个“桥”,以帮助个人以及企业去应对大数据时代所带来的挑战。

虽然目前的ChatGPT还不能为我们的生产方式带来根本性的变革,但是却代表着人工智能的发展已经进入了一个全新的阶段,在这个阶段,用户将不再是被动的接受者,而是一个可以参与到生产过程中的动作发出者,同时AI也将在现实层面上进入用户的生活。

(文章仅代表作者观点。责编邮箱:yanguihua@jiemian.com。)