阿尔特曼在比尔盖茨的播客中透露:OpenAI的ChatGPT将具备视频生成能力

发表时间: 2024-01-12 18:49

IT之家 1 月 12 日消息,据比尔盖茨官方公众号,在最新一期的《为自己解惑》播客节目中,登场的嘉宾是刚刚迎来“新婚之喜”的 OpenAI 首席执行官萨姆・阿尔特曼。

两人分享了自己对 AI 飞速发展过程中人类所处位置的思考,比尔盖茨直言,“我有幸见证了你们工作的进展,但开始的时候我是非常怀疑的,我也没期待过 ChatGPT 能做得这么好。”

阿尔特曼透露了 ChatGPT 未来的“宏伟计划”,包括功能层面将迎来大幅度扩展,以及增强推理能力。当被问及未来两年这款聊天机器人将在何种领域取得“进阶”时,阿尔特曼透露称,包括多模态、语音输入输出、图像生成,最终将是(生成)视频

比尔・盖茨:当你展望未来两年,你认为会有哪些重要的里程碑?

萨姆・阿尔特曼:多模态肯定会很重要。

比尔・盖茨:你指的是语音输入、语音输出?

萨姆・阿尔特曼:语音输入、语音输出,然后是图像,最终是视频。

阿尔特曼还表示,ChatGPT 已经具备了图像和音频(的生成能力),反响“比我们的预期要强烈得多”。但最重要的进步领域“也许”将围绕推理能力展开

现在,GPT-4 的推理能力还非常有限。还有可靠性,如果你问 GPT-4 大部分问题 10000 次,这 10000 次中可能有一次回答得很好,但它不一定知道是哪一次。而你却希望每次都能得到这 10000 次中最好的回答,因此可靠性的提升将非常重要

两人还谈到了自己手机上最常用的 App,阿尔特曼最常用的其实不是 ChatGPT(尽管他自己希望是),而是 Slack(IT之家注:一款利用生成式 AI 完成自动化处理常规任务的 App)。至于比尔盖茨,他则自称是“传统的电子邮件派”,故最常使用 Outlook。