OpenAI 推出创新的 GPT-4o 生成式 AI 技术

发表时间: 2024-05-14 08:14

OpenAI 发布全新生成式 AI 模型 GPT-4o:语音对话更流畅,免费提供

5 月 14 日,OpenAI 宣布推出其最新旗舰生成式 AI 模型 GPT-4o,该模型将在未来几周内分阶段集成至 OpenAI 的各个产品之中。GPT-4o 将免费提供给所有用户使用。

OpenAI 首席技术官穆里・穆拉蒂 (Muri Murati) 表示,GPT-4o 将提供与 GPT-4 同等水平的智能,但在文本、图像以及语音处理方面均取得了进一步提升。

「GPT-4o 可以综合利用语音、文本和视觉信息进行推理,」穆拉蒂在 OpenAI 公司总部举行的主题演讲中表示。GPT-4 是 OpenAI 此前的旗舰模型,可以处理由图像和文本混合而成的信息,并能完成诸如从图像中提取文字或描述图像内容等任务,GPT-4o 则在此基础上新增了语音处理能力。

GPT-4o 采用了全新的技术,让聊天机器人对话的响应速度大幅提升。发布会上 OpenAI 展示了使用 GPT-4o 进行语音对话的演示。演示者提问结束后,GPT-4o 几乎可以即时回应,并通过文本转语音功能进行朗读,让对话感觉更加自然逼真。

另一个演示展示了 GPT-4o 根据要求调整说话时语气,GPT-4o 可以根据指令改变声音,从夸张戏剧到冰冷机械,展现了出色的可塑性。最后,演示还展示了 GPT-4o 的唱歌功能。

以往,OpenAI 发布新版 ChatGPT 模型时,通常会将其置于付费墙之后。不过这次 GPT-4o 将免费提供给所有用户,付费用户则可以享受五倍的调用额度。(来源:IT之家)

​扎克伯格:AI 数据中心 GPU 紧缺正在缓解,电力将成新瓶颈

5 月 13 日,Meto CEO 马克・扎克伯格(Mark Zuckerberg)近日在接受油管 Dwarkesh Patel 频道采访时表示,AI 数据中心的 GPU 紧缺已在缓解过程中,未来的瓶颈将是电力供应。

扎克伯格首先提到,此前一段时间,IT 企业即使资金充足也难以买到全部所需数量的 AI GPU,但这一情况目前已开始缓解。但扎克伯格认为 1GW 级别的数据中心不会很快出现,毕竟这相当于将一整个核电机组的发电能力用于训练 AI。

扎克伯格表示,整体而言各国对能源行业的管理更为严格,这意味着为大型数据中心建设配套能源设施(包括发电站、变电站、输电系统)的审批更为缓慢。同时这些设施本身的建设周期也较长。

AI 数据中心的增长不可能长期维持目前的速度,终将遭遇电力瓶颈:能源行业不同于 AI,资本投入不能在短时间内收获成效,新增电力供给的交付远慢于数据中心本身。(来源:DoNews)

消息称华为 2024 年下半年全面转向其自主平台鸿蒙,彻底放弃 Android

5 月 13 日,据最新消息显示,华为今年下半年将全面转向其自主平台 HarmonyOS,放弃 Android 系统。

报道中提到,下一版 HarmonyOS 预计将随华为即将推出的 Mate 70 旗舰系列一起发布。据悉,HarmonyOS Next 已经扩展到 4000 个应用程序,其中包括支付宝和麦当劳。按照消息人士的说法,HarmonyOS Next 的应用总数将在年内增至 5000 个,华为的目标是在短期内达到 500000 个。

自华为宣布启用自研系统鸿蒙以来,一直有鸿蒙是套皮安卓系统的说法在流行。在 2023 年 9 月 25 日的秋季全场景发布会上,华为正式对外宣布启动 HarmonyOS NEXT 计划,此计划宣布将剔除鸿蒙内核中的 Linux 内核与安卓 AOSP 代码,将不再兼容安卓应用,这也意味着华为鸿蒙将彻底摆脱「安卓套皮系统」这一质疑。(来源:搜狐科技)

谷歌 I/O 大会官宣:Android 15 和 Gemini AI

5 月 13 日,谷歌宣布谷歌 I/O 开发者大会(Google I/O 2024)将于美国当地时间 5 月 14 日举行。

本次大会的重点内容之一是 Android 15,目前谷歌已经推出 Android 15 开发者预览版,该系统在底层支持了卫星通信。目前,一些偏远地区如深山、草原、沙漠、雪地等仍存在通信死角,而卫星通信技术的应用大大增强了智能手机的通讯能力,使我们的沟通方式变得更加可靠和广泛。

除此之外,本次大会的另一项重要内容是 AI,谷歌将会公布 Gemini AI 的最新进展。

据悉,Gemini 是谷歌打造的人工智能模型,可同时识别文本、图像、音频、视频和代码五种类型信息,还可以理解并生成主流编程语言。谷歌计划逐步将 Gemini 整合到其搜索、广告、Chrome 等其他服务中,谷歌也在思考围绕 Gemini 人工智能会有哪些全新的搜索体验,这些都将在 I/O 大会上一一呈现。(来源:快科技)

消息称苹果准备在美国外销售 Vision Pro,中法德日为首批国家

5 月 14 日,据知情人士周一透露,苹果准备开始在美国之外销售混合现实头显 Vision Pro,检验这款售价达 3499 美元(约合人民币 25308 元)的设备是否有更广泛的吸引力。Vision Pro 的市场可能拓展至中国、日本、法国和德国。

知情人士透露,数百名来自中国、澳大利亚、德国、法国、日本、韩国和新加坡的国际零售店员工上周飞赴苹果位于美国加利福尼亚州库比蒂诺的总部,参加为期四天的线下培训,学习如何向客户演示 Vision Pro。

今年 2 月初,当苹果开始在美国市场发售 Vision Pro 之前,该公司也曾在总部对美国零售店员工进行过培训,学习如何向客户演示和回答问题。Vision Pro 在国际市场的确切上市日期尚未宣布,但预计将在今年的全球开发者大会(WWDC)之后扩展到其他国家。今年的全球开发者大会将于 6 月 10 日至 14 日举行。(来源:腾讯网)

微软将在法国投资 40 亿欧元,大部分集中在 AI 领域

微软总裁布拉德·史密斯 5 月 13 日表示,微软将在法国投资 40 亿欧元,其中大部分集中在人工智能领域。

微软将在法国东北部城市米卢斯(Mulhouse)建立一座数据中心。(来源:界面)

​中汽协回应特斯拉通过数据安全测试:对国内外车企一视同仁

5 月 13 日,中汽协常务副会长兼秘书长付炳锋在接受《中国日报》独家专访时表示落实汽车数据处理安全是智能汽车发展的一个新的起点,第一批次所有送检的 6 家中外车企均自主报名参与,包括参加此轮检测的唯一外资车企特斯拉。

「协会秉持对所有送检车企车型一视同仁的原则。第一批检测特斯拉就参与进来了,也是抓到了一个机遇。特斯拉清楚地看到,未来自动驾驶的消费趋势会在中国大市场上率先兴起。」(来源:中国日报)

马斯克式操作:特斯拉重新招聘一些 4 月被解雇的超充员工

5 月 14 日,据媒体报道,马斯克在上月底突然解雇了近 500 名超级充电站团队的员工。然而,不久后,特斯拉便开始重新聘用这些员工,包括北美充电业务总监 Max de Zegher 在内的高管是被复聘的第一批员工。目前尚不清楚具体复聘人数。对于这一情况,马斯克和 Max de Zegher 均未回应网友的提问。

超级充电团队主要负责管理和维护特斯拉的充电站,此前马斯克裁掉这个团队让许多人感到意外,因为特斯拉的超级充电站是公司的「金字招牌」,2012 年,特斯拉就推出了第一批超级充电站。现在,特斯拉在全球有 6200 多个充电站,57000 多个充电头。数据显示,去年全球公共充电需求中有 8% 是由特斯拉提供的。

此外,这并不是马斯克第一次撤回他的决定。在 2019 年,他曾宣布要关闭大多数特斯拉的实体店并转向在线销售,但因为房东们拒绝解除租约,特斯拉不得不取消这一计划,并且提高了车辆价格。2022 年底,马斯克在推特也有过类似的行为。他一开始解雇了大约一半的员工,然后不久又让一些人回来工作。(来源:华尔街见闻)

小米招聘短剧编剧:学历要求大专以上

5 月 13 日,小米集团近日在招聘平台上发布了招聘短剧编剧的信息,引发外界对其进军短剧领域的广泛猜测。

根据招聘信息,小米为短剧编剧一职开出了 20-30k 并且 13 薪的薪酬,要求应聘者具备 1-3 年工作经验,学历要求为大专,显示出小米对这一岗位的急迫需求。

小米对短剧编剧的岗位职责描述包括负责付费短剧的剧本撰写、熟悉剧本开发流程、具备协调沟通能力和剧本把控能力等。

此外,小米还要求应聘者熟悉下沉市场的短剧需求和爆款剧的内容。(来源:IT之家)

魅族旗下首款车型命名「魅族 MX」,搭载 Flyme Auto 全案智能车机系统

5 月 13 日,魅族无界智行官网显示,魅族旗下首款车型将命名为「魅族 MX」。该车型将使用 Flyme Auto 全案智能车机系统。除魅族 MX 外,使用该系统的车型还包括领克 07、领克 08、银河 E5、领克 Zero。

去年 11 月,魅族品牌宣布正式进入汽车市场,将「为魅友们打造一款专属的 DreamCar」。该车将基于 SEA 架构和吉利工业 4.0 制造能力。此外,所有购买魅族 21 的用户在购车时都能直接用原价抵扣购车款,相当于是买车送手机。

魅族还宣布推出了「无界智行开放平台」,向其他车机共享 Flyme Auto 核心能力,今年会有 Flyme Auto 2.0 版本。(来源:IT之家)

雷鸟创新携手谷歌发布全球首款 AR 版的 Google TV

5 月 13 日,消费级 AR 品牌雷鸟创新与谷歌达成合作,面向海外市场发布新款内容终端 Pocket TV。据了解,这是全球首款经 Google 认证的便携式 GTV(Google TV)产品,搭配雷鸟 Air 2 眼镜,用户可通过 201 英寸高清巨幕,接入 GTV 生态。

雷鸟创新相关负责人表示,Pocket TV 支持在线播放、投屏播放、本地播放等多种模式。基于 Google TV 生态,用户可解锁好莱坞大片、热门电视剧集、经典动画片等超过 70 万部影视内容,横跨 10000 个应用。

配置方面,Pocket TV 配备 3GB 内存+64GB 本地存储,支持最高 2TB 的 microSD 卡扩展。内置 6500mAh 大电池,连续播放时约 5.5 小时。还可以当作移动电源,为手机等智能设备反向供电。(来源:钛媒体)

vivo 自研蓝心大模型升级「自研 AI 多模态大模型」

5 月 13 日,vivo 影像新蓝图暨 X 系列新品发布会上,vivo 宣布自研蓝心大模型重磅升级「自研 AI 多模态大模型」,多模态技术让大模型从最原始的视觉、声音、空间等方面接触、感知、理解世界,让大模型更全面、更聪明、更强大。

此外,还发布了多模态大模型技术应用「vivo 看见蓝心升级版」,帮助视障用户更好地「看见」世界。(来源:搜狐科技)

《黑神话:悟空》在 QQ 开启预约,有望登陆腾讯 WeGame 平台

5 月 13 日,《黑神话:悟空》现已在 QQ 开启专属预约渠道,玩家可一键加入官方频道,掌握官方资讯及最新动态,同时还有机会接触游戏策划团队,参与面对面交流。

昨日有爆料称《黑神话:悟空》有望在 5 月 19 日上架腾讯 WeGame 平台,此消息有待证实,但在 QQ 上开启预约增加了该消息的可信度。

《黑神话:悟空》将于 8 月 20 日发售,目前已知将登陆 PS5、XSX / S、Steam 和 Epic 平台,现已登顶 Steam 愿望单。(来源:IT之家)