21世纪经济报道记者 冯恋阁 广州报道
“现在,ChatGPT可以看懂、听见和说话了。”
9月25日,OpenAI宣布在 ChatGPT 中推出新的语音和图像功能。
具体而言,语音功能更新后的ChatGPT将变成用户的“语音助手”随时随地与用户交谈并响应指令。
而图像理解功能使更新后的ChatGPT将能够分析图像中的信息并尝试给出相应结论。“(ChatGPT)可以排查烧烤炉无法启动的原因,探索冰箱中的物品来计划膳食,或分析复杂的图表以获取与工作相关的数据。”官网公告中如此说道。
用户在使用时,可以选取相册中的图片或直接拍摄图像发送给ChatGPT;此外,还能通过多张图片或者绘图工具标注来帮助应用理解。
官网显示,该功能由新的文本转语音模型提供支持,能够仅从文本和几秒钟的样本语音中生成类似人类的声音音频。图像理解功能则由GPT-3.5和GPT-4提供支持,适用于照片、屏幕截图以及包含文本和图像的文档等多种形式的图像。
OpenAI在使用指南中表示,公司将不会保留使用语音功能时产生的音频,并且用户音频本身不会用于改进模型;ChatGPT Enterprise用户输入用以识别的图像也不会保留。
据悉,ChatGPT将在接下来的两周内向ChatGPT Plus 和ChatGPT Enterprise用户推出相应功能。语音功能将在iOS和Android端提供,而图像识别在所有平台上都将可以使用。OpenAI还在公告中表示,未来计划向更大规模的用户群体(包括开发人员)推出类似功能。
人工智能商业化竞赛正走向白热化。今年以来,OpenAI、微软、谷歌公司屡有新动作。
今年年初,微软向OpenAI投资100亿美元,OpenAI的估值达到近300亿美元。
而同样在本月25日,生成式AI平台Anthropic宣布,获得亚马逊(Amazon)40亿美元(约292亿元)投资。
Anthropic被认为是OpenAI强有力的竞争对手,由OpenAI前研究副总裁Dario Amodei等人在2021年创建,主要提供的产品是类ChatGPT应用Claude和Claude2。
该公司在5月已经获得了谷歌等公司的支持,获得由Spark Capital领投,谷歌、Salesforce Ventures等跟投的4.5亿美元融资。尽管本次融资Anthropic并没有披露估值,但在今年3月,公开消息显示,Anthropic估值已超到40亿美元。
更多内容请下载21财经APP