【CNMO新闻】近日,OpenAI官网发布消息称,将对旗下AI大模型ChatGPT进行重大升级。在接下来的两周内,将在ChatGPT中向Plus和Enterprise用户推出语音和图像。语音将在iOS和Android上推出,图像将在所有平台上提供。
ChatGPT
根据官网介绍,ChatGPT新加入的语音输入功能类似于手机上的语音助手,用户只需按下一个按钮,说出自己的问题,ChatGPT就会将其转换为文本,然后生成答案,再将答案转换为语音,播放给用户。
ChatGPT语音输入
OpenAI称,这项新的语音技术能够从几秒钟的真实语音中制作出逼真的合成语音,为许多有创意和无障碍的应用打开了大门。不过该功能可能也会带来新的风险,例如心怀不轨者可能会将该功能用于冒充公众人物或实施欺诈。对此OpenAI表示,这种模型不会被广泛开放,而是会受到严格的控制和限制。
图像输入功能则类似于Google Lens,用户可以拍摄自己感兴趣的事物,并上传到ChatGPT 中。ChatGPT会尝试识别用户想要询问的内容,并给出相应的回答。用户还可以用应用中的绘图工具来帮助表达自己的问题,或者配合语音或文本输入来进行交流。
ChatGPT迎来新升级
OpenAI还放出了一段视频,展示了用户和ChatGPT商量着修自行车的方法,只需不断询问ChatGPT:这里是扳手吗?是调整这里吗?甚至还可以把说明书拍照发给ChatGPT求解释。用户还可以通过拍摄照片,来对图中的问题或者想要完成的事项进行提问,以获得ChatGPT的回应,并给出相应的解决方法。