ChatGPT全新升级：听说读写功能全面整合！

发表时间: 2023-09-26 18:28

21世纪经济报道记者冯恋阁广州报道

“现在，ChatGPT可以看懂、听见和说话了。”

9月25日，OpenAI宣布在 ChatGPT 中推出新的语音和图像功能。

具体而言，语音功能更新后的ChatGPT将变成用户的“语音助手”随时随地与用户交谈并响应指令。

而图像理解功能使更新后的ChatGPT将能够分析图像中的信息并尝试给出相应结论。“（ChatGPT）可以排查烧烤炉无法启动的原因，探索冰箱中的物品来计划膳食，或分析复杂的图表以获取与工作相关的数据。”官网公告中如此说道。

用户在使用时，可以选取相册中的图片或直接拍摄图像发送给ChatGPT；此外，还能通过多张图片或者绘图工具标注来帮助应用理解。

官网显示，该功能由新的文本转语音模型提供支持，能够仅从文本和几秒钟的样本语音中生成类似人类的声音音频。图像理解功能则由GPT-3.5和GPT-4提供支持，适用于照片、屏幕截图以及包含文本和图像的文档等多种形式的图像。

OpenAI在使用指南中表示，公司将不会保留使用语音功能时产生的音频，并且用户音频本身不会用于改进模型；ChatGPT Enterprise用户输入用以识别的图像也不会保留。

据悉，ChatGPT将在接下来的两周内向ChatGPT Plus 和ChatGPT Enterprise用户推出相应功能。语音功能将在iOS和Android端提供，而图像识别在所有平台上都将可以使用。OpenAI还在公告中表示，未来计划向更大规模的用户群体（包括开发人员）推出类似功能。

人工智能商业化竞赛正走向白热化。今年以来，OpenAI、微软、谷歌公司屡有新动作。

今年年初，微软向OpenAI投资100亿美元，OpenAI的估值达到近300亿美元。

而同样在本月25日，生成式AI平台Anthropic宣布，获得亚马逊（Amazon）40亿美元（约292亿元）投资。

Anthropic被认为是OpenAI强有力的竞争对手，由OpenAI前研究副总裁Dario Amodei等人在2021年创建，主要提供的产品是类ChatGPT应用Claude和Claude2。

该公司在5月已经获得了谷歌等公司的支持，获得由Spark Capital领投，谷歌、Salesforce Ventures等跟投的4.5亿美元融资。尽管本次融资Anthropic并没有披露估值，但在今年3月，公开消息显示，Anthropic估值已超到40亿美元。

更多内容请下载21财经APP