深度解析:ChatGPT、人工智能的奥秘与AIGC、AGI的关系

发表时间: 2024-01-22 21:43

2022年底ChatGPT一经问世,立刻在全球范围内引发巨大轰动,成为人工智能界的“顶流”。一时间,人工智能、大模型,AIGC、AGC ,Transformer 等名词和概念火遍大街小巷。

但人工智能究竟是什么?ChatGPT究竟意味着什么?AIGC、AGC 这些AI热词又是什么关系呢?

1、ChatGPT是什么?

ChatGPT简单来说,就是一种可以聊天对话的机器人(模型)。Chat意为聊天对话,代表应用功能,GPT(Generative Pre-trained Transformer)意为生成式预训练Transformer模型,Chat+GPT,就=ChatGPT。

但这款机器人模型,并不是普通的聊天模型,而是比战胜世界围棋冠军的AlphaGo以及能够预测蛋白质结构的AlphaFold更惊艳的存在。因为它不仅是可以聊天对话,聊天能力强,还可以帮你出建议,写策划、写文案、写诗写歌,甚至编代码,十八般武艺,样样都会。

更重要的是,它能够以接近人的方式进行思考和对话,初步具备了人类的思考和逻辑能力。这是它最核心,最具里程碑式存在的意义。由此开启了人类步入通用人工智能AGI的新纪元。

2、通用人工智能,AGI?

通用人工智能(General Artificial Intelligence) 简称AGI,也称强人工智能,就是拥有通用能力,可以解决多种任务的机器人。传统的人工智能虽然解决问题的能力可以很强,甚至超越人类,如AlphaGo和AlphaFold,但还只是在单一领域,只能解决特定的问题和任务。

当然,通用人工智能的含义远不止于突破单一领域,拥有通用能力。而在于完全以类人的方式感知和理解世界,像人类一样思考,决策。能表现出正常人类的所有智能行为,执行人类能够执行的所有任务,具备与人类同等的甚至超越人类的智慧。

想象一下,地球上出现了一个与人类同等智慧,甚至可能超越人类的物种,那么人类将如何生活?如何与之相处呢?

所以通用人工智能,将对人类,对人类社会产生颠覆性影响,给我们的生产和生活方式带来划时代的变革,一点也不夸张。ChatGPT的出世也被认为开启了第四次科技(工业)革命。

不过,回过头来看,AGI还是人工智能未来的大方向和趋势,ChatGPT虽然确确实实展现出了一些AGI的影子,但还处于弱人工智能阶段,距离真正的AGI还很远。目前主要的变革还集中在内容变革AIGC方向上,这也是主要的应用和创业投资领域。

3、内容生产,AIGC?

AIGC(Artificial Intelligence Generated Content)就是以人工智能(AI)的方式生产和生成内容。之前我们生产内容的方式主要为PGC和UGC,即由专业创作者,如媒体人、作家、设计师等生产(Professional Generated Content)和由用户生产(User-generated Content)比如短视频。

现在的AIGC,利用人工智能进行生产,是一种新型的内容生产方式,开启了内容生产领域的变革。

AIGC不仅在多样性上,可以生成文本、图像、音频、视频、代码、游戏、影视等各种类型的内容,而且在效率、质量上也推动了内容生产的大踏步前进。

比如通过Jasper公司的产品,用户可以轻松完成Tik Tok视频脚本、广告营销文本、电子邮件等重复性工作,Midjourney生成的AIGC绘画作品《天空歌剧院》可以在新兴数字艺术家竞赛中获得一等奖,OPenAI发布的MuseNet 可以模仿10种不同乐器,并融合不同的音乐风格,创造全新的音乐作品。

那么为什么现在的AI这么厉害?基本具备人的逻辑能力,能够轻松和人交流对话,还能够进行内容创作呢?答案就是深度学习模型。

4、深度学习,Transformer,GPT,Diffusion ?

AI能够发展到现在这种初步具备人的逻辑和思维能力的水平,主要在于建立了模仿人类思考、记忆的神经网络模型。我们人的大脑中含有约1000亿个神经元,平常记忆、思考,就是依靠神经元彼此连接而形成的神经网络来进行的。

通过模仿这种神经网络,再“喂”给模型大量的语料和数据,它就可以从中“学习”,总结出逻辑规则或函数,然后依据规则生成内容。因为它可以像人类归纳并总结出规律,进行“深度学习”,所以神经网络模型又叫深度学习模型。

CNN(卷积神经网络)、RNN(循环神经网络)、GAN(生成对抗式神经网络)都是比较经典的深度学习模型。当然还有现在深度学习最先进的成果:ChatGPT和GPT系列所使用的Transformer 模型和AI绘画领域所使用的Diffusion模型。

GPT系列以Transformer为基础,通过不断提升训练语料规模和参数数量,进行迭代更新,主要有GPT-1,GPT-2,GPT-3,以及2023年刚发布的GPT-4。ChatGPT是在GPT-3.5模型的基础上,进行微调的模型。

微调,就是通过少量特定领域的数据对预训练模型进行微调训练,以满足特定的功能,比如Chat功能。深度学习模型一般分为“预训练+微调”两个阶段,微调是第二个阶段,第一阶段的预训练主要得到基础模型。

AI绘画领域主要使用的是Diffusion模型,Midjourney、OpenAI 公司发布的DALL.E2、Stability AI公司的Stable Diffusion都是使用的Diffusion模型技术。

最后,由于这些模型使用了规模非常庞大的训练数据和参数,比如GPT-3参数量达到了1750亿,千亿级别,所以又被称为大模型。

END.