一篇文章带你读懂生成式人工智能
Éric Moulines
巴黎综合理工大学统计机器学习教授
Hatim Bourfoune
法国国家科学研究中心(CNRS)密集型科学计算开发与资源研究所(IDRIS)人工智能研究工程师
Pierre Cornette
法国国家科学研究中心(CNRS)密集型科学计算开发与资源研究所(IDRIS)人工智能支持工程师
人工智能的发展日新月异,生成型AI是其中的一种,它能够根据输入的指示,创造出各种文字、图像或声音的内容。这种技术有什么原理?它有哪些应用和局限?它又会带来哪些挑战和风险?本文将为您介绍生成型AI的基本概念、最新进展和未来趋势,让您了解这个正在改变我们社会的创新领域。
生成式AI,指能够学习数据库中的信息,并以此为基础,根据用户输入的提示生成文字、图像或音频的人工智能。
生成式AI仍处于蹒跚学步的阶段,有许多需要改进的地方,比如答案不够可靠或带有偏见。
ChatGPT、Bloom都属于生成式AI的应用模型。潜在的应用还有千千万万待探索。
任何技术有利必有弊。生成式AI耗能极高,而且存在被滥用的风险。
ChatGPT已经成为了当今社会的热议话题,新一轮AI技术革命已初露端倪。生成式AI有看似无穷的潜在应用场景,也毫不意外地引发了无休止的争论。不过,大众对于生成式AI 原理的理解似乎还有待加深。
生成式AI,指能够学习数据库中的信息,并以此为基础,根据用户输入的提示生成文字、图像或音频的人工智能。巴黎综合理工大学的统计机器学习教授Eric Moulines解释说:“AI在学习的过程中,会从数据中概括规律,并基于此生成具有原创性的内容。”
目前两种主流的人工智能模型分别是GPT(生成式预训练转换器)和扩散模型。法国国家科学研究中心(CNRS)密集型科学计算开发与资源研究所(IDRIS)的人工智能研究工程师Hatim Bourfone补充说:“人工智能会通过一种‘注意力机制’理解输入文本的上下文含义。其输出的内容由其之前在训练阶段学习的词汇构成,AI会根据每个词出现的概率,判断接下来该使用哪个词”。用不同的数据库训练算法,便能得到适用于不同情景的AI。
Bourfoune的团队参与开发了一款名为Bloom的AI,这是一款供研究人员使用的学术论文翻译器。IDRIS 研究员Pierre Cornette 说“Bloom模式的主要任务就是学习多门外语。我们给它输入了大量的文本,然后让它根据前文内容去判断下文该出现哪个词。如果出错了,我们会纠正。”
01
蹒跚学步的新技术
Moulines解释道:“第一代生成式AI模型的历史还不到十年。生成式AI技术的首次突破发生于2017年:转换器技术问世,完善了注意力机制。到2021年,商用生成式AI就上市了,速度之快令人乍舌,比其他深度学习模型都要快得多。”尽管如此,我们必须认识到ChatGPT等AI仍处于蹒跚学步的阶段,有许多需要改进的地方。
Moulines承认,GPT给出的答案的可信度不够高,仍然是个问题:“ChatGPT不知道什么是‘可信度’,不懂得评估自己给出的答案的准确性。”这就是为什么有时候ChatGPT会“一本正经地胡说八道”。“由于ChatGPT纯粹根据概率推理来生成单词序列,所以会生成看似可信,实则虚假的内容。”
除了会“瞎编”,生成式AI还有一些其他的缺陷需要引起我们的注意。AI在深度学习过程中,会大量吸收现有文本,也会内化其中的偏见。Moulines说:“如果你问ChatGPT地缘政治问题,得到的答案都是西方国家的立场。这样的答案中国用户肯定不会认同!”
02
无穷无尽的潜在应用
生成式AI的魅力在于,通过使用多样化的学习数据库,能够开发出无穷无尽、功能各异的模型。Cornette 说:“生成式AI就如同一台高功率的发动机,可以搭载在拖拉机上,让其发挥最大牵引力,也能安装在赛车中,让其飞驰而过。”若把ChatGPT比作一辆赛车,GPT-4就是它的发动机。“发动机是核心技术。开车的人不须要知道发动机的原理,也能在赛场上风驰电掣。”
Bloom也能反映生成式AI模型的广泛应用潜力。Bourfoune说:“一年前,Bloom是唯一一个对学界完全开放的模型。”任何人都可以下载Bloom并用于自己的研究。经过多语种科学论文数据库的训练,Bloom现在能帮学者轻松理解外语论文。Cornette补充道:“Bloom的开发团队还发起了一个叫Bigcode的项目,用于计算机代码自动生成。只要简单地描述代码的功能,Bigcode就可以用用户指定的编程语言写出具体的代码。”
ChatGPT现在大受欢迎,表明一般用户已经意识到它的实用价值。为了与谷歌竞争,必应已经将GPT的聊天功能整合到其搜索引擎中,这种做法一定程度上能克服生成式AI“胡说八道”的缺点:必应聊天给出的答案中会标注信息来源,便于用户理解并验证内容的可靠性。最近,Adobe将生成式AI模型集成到Photoshop、Illustrator等软件中,展示了另一种新颖应用。
03
激动人心的未来
从当前的应用来看,生成式AI必将迎来令人振奋的未来,然而也有人担心这一技术可能被滥用。Bourfoune承认:“任何技术有利必有弊。这就为什么OpenAI设置了多重安全屏障。” OpenAI的内容政策也带着这些安全因素的考量,因此在涉及ChatGPT运作的许多问题上,OpenAI都选择保持沉默。
对于仍处于起步阶段的生成式AI技术,Moulines表示:“我们在研究中清楚地知道技术还在起跑线上。生成式AI已经能实际使用,这一点我们都觉得惊讶。”不过,技术仍有许多法律监管等各方面的空白有待填补。由于生成式AI以现有内容数据库为基础生成内容,可能会“剽窃”他人的作品,而不提及原作者的姓名。“以既有内容创作新作品,必须声明原作来源。AI的行为涉嫌侵权。”
尽管生成式AI有各种局限性,但潜力依旧巨大。Moulines 说:“想到未来这一领域可能发生的突破,我心情十分激动。生成式AI的发展势不可挡,衍生应用将如雨后春笋般出现。现在大家都在争相开发新技术,进展很快。” Bloom就属于一种衍生应用,既能促进科学家之间的跨语种交流,又能将论文翻译成稀有小语种,促进科研结果的传播,还有望用于保存濒临灭亡的语言。
不过,在激动之余,不能忽视生成式AI的碳足迹。Moulines解释:“这些模型须要存储大量数据,故需要大量内存。根据我们的估算,OpenAI消耗的能量相当于比利时整个国家电网的耗能。”未来,能耗可能会是生成式AI发展道路上最大的阻碍。
作者
Pablo Andres
编辑
Meister Xia