这是 OpenAI COO Brad Lightcap 在旧金山 Bloomberg Tech 上展开的最新对话,Lightcap 谈到了 OpenAI 在 AI 方面的商业应用。
Lightcap 重点阐释了 AI 技术如何为企业带来差异化价值,并提升客户体验和创新能力。 此外,Lightcap 也谈及了与微软的紧密合作关系,包括 Sora的最新进展,以下为这次对话全部内容:
主持人:
Brad,当你在 2018 年的早期加入 OpenAI 担任 CFO 时, OpenAI 实际上并没有产品,更别提商业模式了。你能告诉我们一些关于你如何帮助将公司从当时你所称之为一家“昏昏欲睡的研究机构”转变成一个真正的业务的过程吗?
Brad Lightcap:
我在 2018 年加入了 OpenAI ,这在当下感觉像是远古历史了。当时我们甚至还没有进入现代 AI 的时代,也就是现在我们所说的基于 Transformer 结构的架构,这是支撑我们每天使用的 LLM 的基础。那时完全不在我们的视野之内。我们专注于一种非常不同的 AI ,称为强化学习,其中你训练这些 Agent 基本上是超越人类在任何给定任务上的能力。
因此,我们正在尝试将其应用于尝试击败人类在视频游戏中。实际上,我们有一个项目,我们让一个 Agent 与世界上最好的 Dota 玩家对战,如果有人熟悉 Dota 的话。我们正在应用相同的原则进行机器人研究,以查看我们是否可以教会机器人手如何操纵魔方。所以我在 2018 年坐在这里,试图弄清楚我们要成为一家什么样的业务。
我们大概会是介于游戏公司和机器人公司之间的某个地方。但是,Reed Hoffman 实际上在我们早期的帮助我们思考这个问题时非常有帮助,真正的 Reed,而不是AI 数字人 Reed ?
因此,我们最终看向了那个方向,但感觉仍然很早。后来当 Transformer 问世, LLM 开始发挥作用时,一开始就感觉到那将是重要的事情。
主持人:
OpenAI 的使命是构建 AGI ,对吧?有一天可能会超越我们人类的智能。对于仍然对此感到相当恐慌的许多人,包括潜在的客户,你会说些什么?
Brad Lightcap:
是的, AGI 显然是一个雄心勃勃的目标。我认为没有人对 AGI 有一个完美的定义。我们有时开玩笑,也许我们只会在看到它时才知道,但我们试图将其定义为一种基本上能够执行大多数任务的系统。因此,如果你把它用于某个任意复杂或困难的任务,它可以着手解决,它可以推理出它需要什么工具、需要什么数据,如何提出跟进问题,就像人类有这种一般的推理能力一样,我们认为AI系统也将在某个时候具备这种能力。这是令人恐惧的,对吧?有这样一个系统,具有某种程度的代理和自主性存在于世界上,能够做出决策,能够使用工具,能够访问互联网并编写代码,这是一件非常大胆的事情。
因此,当我们成立 OpenAI 时,我们真的将其塑造成这样一个公司,我认为我们希望成为一个非常以使命为导向的公司,安全和广泛的利益是我们运营方式的核心。我们试图提出一个真正反映这一点的结构,因此我们不必将我们认为不安全的事情放在我们认为安全的事情之前。因此,我们尽力了解人们如何使用这项技术,在早期规模上进行应用。了解人们如何使用像 GPT-4 这样的系统实际上有助于我们思考下一个东西可能如何被使用,我们可以改进我们的安全系统和技术。我认为如果我们采取这种迭代的方法,并能够与人们就他们希望这项技术做什么进行全球对话,无论是在新事物方面,还是在需要安全性开始的领域,我们都会达到目标,并且对结果会非常满意。
主持人:
Sam 说过,与将来相比,现在的 AI 模型简直是愚蠢得可笑。你说今天的 AI 在一年后看起来会令人发笑,然后 AI 将被用于更复杂的工作。那么,这个 AI 将如何变得更聪明、更复杂,更好呢?
Brad Lightcap:
是的,我们认为系统会变得更好,说今天的系统是最愚蠢的名人,这在于我们认为下一个系统肯定会更好。我认为我们需要理解这意味着什么。但实际上,这也是对当前系统的一种评论,即这些系统并不那么有能力,如果你仔细想想的话,对吧?这些系统你可以问问题,它们有这种像神谕般的接口。它们可以给你一个答案,这大概就是它们的能力的范围了。它们可以模仿一定水平的智能、情感智能,如果你要求它们变得有趣的话。但是,我听过有人将它们描述为在很多方面,它们其实只是世界上最好的魔术伎俩。
现实中情况并不完全如此。GPT-4 实际上在企业中有着惊人的应用,这让我们非常惊讶。如果你愿意的话,我们可以稍后回来讨论这一点。但我们确实认为下一个系统将必须跨越一种实用性和能力上的鸿沟,能够走出去并且有用,帮助你实际做事情,比如真正地对你有所帮助。为了实现这个API的目标,我们需要朝着这个方向努力。
主持人:
你会说未来它更多地成为 Agent ,而不仅仅是一个聊天机器人,或者我们会以其他形式使用你们的技术吗?
Brad Lightcap:
我觉得我们往往在拥有这些东西之前并没有足够的词汇来描述它们。词汇往往会在当前技术的基础上发展。例如,一个有趣的问题是,例如在2026年或2027年是否会有所谓的“提示工程师”,你会尝试调整提示以使其更好。你不会为你的朋友调整提示。你可能会为你的孩子调整提示,但你和我不必坐在这里交换提示草稿来让彼此理解。所以,这似乎是特定于这个时代的东西。我认为,我们将会审视下一个系统,描述它们能做什么的方式将会是根据它们的能力和缺陷而具体化的。
主持人:
ChatGPT 一推出就成为史上增长最快的消费者应用之一,这在内部也很难超越,对吧?那么你认为,对一些人来说,新奇感是否在消退?在这样一个病毒式的起步之后,你如何继续增长?
Brad Lightcap:
是的,我们确实以研究为先的态度来看待这个问题,即如果我们只是在建立一个名为 GPT-4 的东西,而这是任何东西都会变得更好的最佳选择,那么我认为我们将坐在这里说,好的,让我们真正地去想方设法最大限度地优化 GPT-4 的规模产品,我们更关心的是学习人们如何使用这项技术。
我们试图在 ChatGPT 初期进行的一个练习是,我们试图,在经典的商业运营风格中,我们试图对所有的用例进行限定,理解,好的,我们是否发现了一个我们确定的通用用例,我们可以基于这个用例来改进产品的下一个版本,因为我们会让它在这个方面变得更好。但我们与的人们交谈的数量,他们说,我没有用例。我用它来帮助我规划孩子的生日派对,然后下一秒我用它来帮我写代码,再下一秒我用它来帮助我年迈的父母导航他们的医疗保健。你可以看到,这只是使用情况的多样性,这使得很难知道如何改进它,除了使模型变得更聪明和更好。
主持人:
好的。你们一直在大力发展企业业务,我知道在企业方面有一些非常令人兴奋的应用。你们与现代制药最近达成了一项协议,我知道你们与其他几家公司也有一些合作。我们可以谈谈更多的细节。但我也想问,当我们看到 ChatGPT 出现这种飞跃时,对AI的潜力产生了很多早期的期望和承诺。我认为也公平地说,虽然在 ChatGPT 问世的一年半以来,AI 有很多前景,但我们还没有看到它彻底重塑我们的经济或大多数人的日常工作。对于那些怀疑 AI 是否会像一些人所夸大的那样产生重大影响的人,你怎么说?
Brad Lightcap:
好的,我们有一年的时间来重塑经济。这是一个艰巨的任务。我之前说过,企业采用和这些工具在企业中的效用实在是让我们吃惊。想想这个评论,我们认为即使我们回到家中,决定结束我们正在做的事情,作为技术的学生,我目前非常有信心,我们会有这样一个 10~20 年的时间段,通过经济中的 GPT-4 或类似的技术进行扩散。在某个时候,我们会有一个更好的系统,我们将不得不把所有人都迁移到这个新系统,然后开始着手解决如何融入其中。所以我们对此感到非常鼓舞。
我们研究的事情是,这些系统如何在企业中产生差异,帮助企业更好地了解他们的客户,与用户建立更个性化的关系,允许他们创建新的产品体验,让他们真正做些他们原本不能做的事情。这些都是人们正在使用这项技术的例子。因此,我们的工作真正是,我告诉我们的团队,我们基本上是这种谁都不知道它,今天什么是可能的,今天什么不可能的,到明天可能是什么可能的,明天可能是什么不可能的。
主持人:
你一直在 OpenAI 负责与其他公司的合作伙伴关系。这是你工作中非常有趣的一部分,因为你目前正在与媒体行业合作得很密切。最近,你们与《金融时报》、Dotdash和 IAC 旗下的 Meredith 等公司达成了一些协议。你们还在与其他几十家出版物进行谈判,探讨如何将 ChatGPT 整合到产品中,并许可内容。我们可以期待多少笔交易?我知道这有点玩笑,但你认为最终会有多少出版商成为 ChatGPT 生态系统的一部分?
Brad Lightcap:
是的,我们认为这项技术在这个领域有着惊人的应用。所以,如果你将其简化为最基本的原则,出版业实际上就是向受众传达信息的业务,并允许受众以满足他们想要或应该了解的内容为满足对象的方式参与到他们关心的主题中。当你用这样的方式来表达时,几乎以一种平实的语言来表达时,你会意识到,这些AI系统实际上几乎是为增强这种体验而量身定制的。
如何更好地理解一个主题?如何增强记者报道某事的能力?如何让人们更多地接触数据并能够与数据互动?我们生活在一个数据驱动的世界中。这就是我们在出版业中看到的机会,这是我们为之兴奋的。我们还有很长的路要走,我认为,我们需要构建这些工具,并开始与该行业合作以达到目标。但我们承诺要做这项工作,这真的是我们合作努力的基础所在。并且能够将信息作为真实来源带入 ChatGPT 的体验中。
人们对这些模型究竟可以和应该用于什么有一种有些错误的认识。它们实际上不是数据库。所以,如果你将它们用作数据库来存储信息,它们并不是百分之百准确的,而且它们非常昂贵。我们已经建立了更好的数据库技术。这些模型实际上并不是用来回忆事实的。它们实际上是用来推理新信息的。
因此,你可以让它们获得更多的信息,这就是我们在考虑出版商合作时的想法,将更多的信息带入他们的视野中,我们认为它们对人们更有用。最终,我们认为这对世界是有益的。
主持人:
你最近还去了好莱坞,与制片人、导演和创意人士谈论了 Sora ,对吧?你们的文本到视频生成器,这些谈话进行得如何?我记得我们曾用“AI 走向好莱坞”这样的标题报道过。告诉我这是什么感觉。
Brad Lightcap:
是的,非常积极。所以我们几个月前发布了 Sora 作为我们的文本到视频模型,但我们并没有发布它。
有趣的是,这实际上是一个我们如何考虑迭代部署的例子,也就是将一些东西放在世界上,让人们开始欣赏它是什么,就开始谈论它可能如何使用,也给了我们一个机会,得到了一些反馈,以改进它的方法,并能够与那些将会真正产生影响的人们交流。
这里的反馈非常有帮助。我们学到了很多我们不知道的东西,也就是视频内容是如何为人们、为行业内的创意人员制作的,现在我们可以回去考虑如何将这些东西纳入模型中。
实际上,结果显示,很多创意人士,尤其是在电影制作的高端,真的很关心诸如摄像机角度是比预期的高或低 5% 之类的事情,我想要重新拍摄它,稍微调整一下,这是一个有趣的研究问题。所以进行这样的对话,我认为是至关重要的。
我们的希望实际上是,如果你能降低制作成本,无论是一部完整的电影,我们还没有接近,但即使是电影的一部分,反馈中一直存在的一件事是,你会看到更多的东西被制作出来。
因此,有很多东西因为太昂贵而被搁置了。所以如果你能在行业中产生一些通货紧缩的影响,会有更多的东西被制作出来,比如史诗片、西部片等等,现在很少见到。我们认为这是技术的承诺。
主持人:
那么你认为我们离这个成为一个真正的产品,你可以拿出去卖给好莱坞或其他人,是几个月还是几年的时间?
Brad Lightcap:
我们现在有什么就是什么。我们认为我们可以让它变得更好。所以我们仍然会把它看作是一个研究问题,但它将是协作的,我们希望在这个过程中能得到创造性的输入。
主持人:
说到 Sora ,正如你可能已经看到的,有很多关于训练模型所使用的训练数据的讨论。你能否一劳永逸地澄清一下, Sora 是否是在 YouTube 数据上进行训练的?
Brad Lightcap:
是的,我是说,围绕数据的讨论非常重要。我们显然需要知道数据来自哪里。实际上,我们本周发布了一篇关于这个话题的文章,基本上是关于 AI 需要像内容 ID 系统一样,让创作者了解随着他们创作的内容走向何方,谁在对它进行训练,能够选择参与和退出训练,能够选择参与和退出使用内容。
此外,另一方面,还能够积极地允许你的内容被放入模型中或被模型访问。因为在这一端可能存在其他的经济机会。这也是我们正在探讨的内容,即如何在与网络、创作者和出版商之间建立完全不同的社会契约,当这些模型走向世界并执行一些有用的任务时,创造价值的程度是能够引用和整合网络内容的。应该有一些方式让人们能够从中获益。
我们正在思考这个问题。这真的很困难。我们还没有所有的答案,也许得到 2026 年。如果你有任何想法,我们愿意听取。但这是一个大问题。所以暂时没有关于 YouTube 的答案。
主持人:
我想谈谈的最后一个合作伙伴关系可能是最重要的一个,那就是与微软的合作伙伴关系,对吧,你们的投资合作伙伴。你是如何应对与一个有时可能被视为竞争对手的合作伙伴的关系,他们也在销售类似于你们的企业产品?
Brad Lightcap:
是的,他们是一个了不起的合作伙伴。我认为,世界上没有多少公司能够在我们与微软合作构建系统的规模上达到这种水平,而且还能容忍我们。我们行动迅速,要求很高,他们将其视为帮助微软在系统构建方面变得更好以及更好地理解AI的机会。我们认为这个市场非常巨大。
因此,我们的看法是,我们是一家小公司。我们创造技术,我们有一个关于我们想要如何以及在哪里创造和部署这些技术的观点。他们也是一家公司,有他们自己的一套产品,有他们自己的一套客户。最终,正如你之前提到的,如果我们要在经济上产生任何实际影响,我不认为仅仅是 OpenAI 作为一个独立的公司走出去按下按钮就能实现这一点。
与合作伙伴合作对我们来说非常重要。因此,从市场推广的角度来看,这是我关注的重点,我们将他们视为这一方面的一个绝对关键因素,当然还有我们合作的所有其他伙伴。所以这一直非常积极,我认为未来还有很多工作要做。
本文由人人都是产品经理作者【江天 Tim】,微信公众号:【有新Newin】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自采访视频截图