Khosla,OpenAI的首位投资者,分享他对AI和人机交互未来的看法

发表时间: 2024-02-26 17:26

Khosla指出,语言将主导AI交互界面,同时AI应用正逐步适应人类。AI正创造人为中心和基于代理的未来。

这是 OpenAI 首位投资人 Vinod Khosla 关于 AI 交互与革命的最新洞察。Khosla 对常见术语“AI 硬件”和“小工具”表示怀疑,他主张从一个新的视角来看待这些设备,认为它们是即将到来的时代中不可或缺的组成部分,这个时代的特点是以低延迟语音交互作为主要的用户界面

Khosla 强调,这不仅仅是关于设备的讨论,而是关于人机交互根本性转变的讨论。他认为 AI 将在我们与技术的关系中引发两个根本性的变化。首先,语音——已经是最自然的人类互动界面——将成为主导的交互界面。

想象一下,延迟时间减少到不到半秒,这与基于触摸的设备的迟缓形成了鲜明对比。甚至“无声语音”也在讨论之中——在公共场合如咖啡厅中,无需发出声音即可发出命令。通过检测这种“无声言语”,技术将允许人们在公共场所私下口述,而不被旁人听见。

第二个变革是应用程序将如何适应我们。不再需要像学习使用 Uber 或SAP、Oracle 这样的复杂系统一样,去学习如何导航应用程序。

到目前为止,我们总是在适应软件——学习它的复杂性,记住层次化的菜单等等,以此来与机器通信。

现在,AI 正在使软件适应人类。这将导致新类型的硬件的诞生,这些硬件主要设计用于语音互动,计算机学习人类的语言和人类本身。虽然对于某些视觉任务可能仍然需要屏幕,但核心交互将转向语音——无论是无声的还是有声的。

设计师 Jony Ive 和 OpenAI 的 Sam Altman 讨论了一个 AI 硬件项目。多年前开始的 Humane 猜测了这种接口——但早期的热度很快消退了。这些企业家的方向是正确的,但他们的实现没有充分专注于 AI 使能的新用户体验

Rabbit 凭借其最小化的设备引起了轰动,使得微软(410.34,-1.31,-0.32%)CEO Satya Nadella 称其 R1 发布为“我看过的最令人印象深刻的展示之一,自 Steve Jobs 在 2007 年介绍 iPhone 以来,捕捉到了什么是可能的愿景。”

Khosla Ventures 也是 Rabbit 的投资者之一,有新 Newin曾在第一时间分享过《【2.1 万字实录】Rabbit 创始人&CEO 吕骋最新对谈|R1 更像是 AI + iPod,而不是 iPhone 杀手》。

Khosla 认为 Rabbit 是重新定义人机交互在强大 AI 世界中的早期尝试。这些设备将围绕着我们应该通过自然语言用声音与计算机(或可以为我们运行应用的代理)对话的理念为中心,而不是通过人造构造。

以 Khosla 个人的生活习惯为例。当他徒步时,他会使用一个叫做 Picture This 的应用来识别我遇到的植物,但这个过程很麻烦:停下来,暂停有声读物,打开应用,拍照,等待答案加载,关闭应用,把手机放回口袋。

有了这项新技术,他只需将设备指向植物并问:“这是什么植物?”便会得到答案,然后我可以说“播放有声读物”并继续听我的书,无需中断或麻烦。

从成本角度看,这种以语音驱动的方法是一个游戏规则的改变者。它比传统的智能手机要便宜得多。形态因素的创新也很可能,尽管配备更大屏幕的手机不会消失。

Rabbit 的大型动作模型(LAM),基于神经符号方法,学会使用软件应用并跨应用工作,因此人类不需要了解其他应用或网站。Rabbit 的代理将与人类交谈并为他们使用这些应用。

语音比打字或触摸屏更简单、更高效。高分辨率图形和触摸界面要求昂贵、复杂的计算。相比之下,驱动 ChatGPT 和其他聊天机器人的非常大的 5000 亿参数大型语言模型试图学习所有曾经发布的内容。

Rabbit 的 LAM 表现得更像是学习如何使用应用和其他 LLM 的人类,因此人类不需要学习它们或掌握提示工程。LAM 学习使用软件的方式就像人类一样,而不是通过应用程序编程接口与应用通信,如传统软件所做的。

想象有人在你滑动手机时偷看你的肩膀并学习那些模式。那就是 LAM——或者未来可能被称为的东西。这是传统范式的完全颠覆,意味着最终我们不必与软件交互,因为 AI 将代表我们这样做。

手机,就像现在这样,被设计来分散我们的注意力。如果 Khosla 在徒步时不得不拿出手机,会看到电子邮件、短信和其他通知;他会被拉进某个社交平台,被广告打扰,甚至可能下陷入一个漩涡,毫不夸张地说。

手机不断争夺我们的注意力,将我们拉入通知和消息的漩涡。这些新设计,如 Rabbit,旨在节省时间并最小化分心。你告诉它要做什么,它就仅仅做那个,没有更多。

初创公司可以如此敏捷和创新!技术的未来不是关于渐进式变化或过去的外推,这不仅仅是关于制造另一个 iPhone 16 或 17——尽管那些将继续非常有价值。这是关于我们与设备互动方式的根本性转变,这是以 AI 为中心的,需要新的设计和新的优先级,硬件支持。初创公司最适合这样的转变。现有的大公司肯定会慢慢跟进。

这就像 Apple 支配手机市场之前的手机市场。在 2006 年,大名鼎鼎的是 Nokia、Motorola,也许还有 Samsung 和 BlackBerry。Apple 当时甚至还没有进入这个画面。

然后它突然推出 iPhone,彻底改变了游戏规则。通过一个创新的以用户为中心的触摸界面,在这个高度便携的计算机中,成为可能的数百万应用。

正因为下一个阶段不是关于硬件或小工具,而是关于人类与计算机互动方式的彻底改造,我们将把像 Rabbit 的 R1 这样的设备添加到我们的装备中。我们将使用一个按钮设备,通过自然语言驱动大多数互动,屏幕如我们所知将成为次要。

这些新设备能够做的很多事情可以通过在传统设备如智能手机上的“代理”应用来完成。但智能手机不提供亚秒级的、无干扰的互动和其他独特功能,这些是人类中心的 AI 将启用的。

新技术将出现以支持这个生态系统,如 植入隐形眼镜和眼镜的显示器 和许多不同的方法来 无声言语,以便在公共场所隐秘地使用设备。

这些设备正在发明一个以人为中心和基于代理的未来,由新的 AI 技术启用。Rabbit 正在对此进行真正的尝试,这不仅仅是一个渐进式的变化。其他人肯定会跟进,创造许多便于携带和使用的设备。

Apple 带给我们“有一个应用可以做到那个”的世界。Rabbit 式的设备将带给我们“有一个 AI 可以做到那个”的世界,通过一个以语音驱动的个人代理访问,可以为你运行应用(END)。

本文源自金融界