阿里云CTO周靖人谈通义千问:开源与闭源模型的新平衡

发表时间: 2024-07-05 18:44

今日,阿里云在上海世界人工智能大会上向所有人交出了一份成绩单。

据阿里云官方介绍,近 2 个月来,通义千问开源模型下载量增长 2 倍,突破 2000 万次,阿里云百炼服务客户数从 9 万增长至 23 万,涨幅超 150%。

借此,阿里云 CTO 周靖人也重申了阿里云拥抱开源开放的坚定立场:

两年前,我们在世界人工智能大会上发布通义大模型系列,当时我们公布,通义核心模型将开源开放。到今天,通义千问已经实现真正意义上的全尺寸、全模态开源,拉平了开源、闭源模型之间的差距。

近一年来,通义模型系列持续进化,基础模型性能也得到了不断提升。

从 OpenCompass 基准测试结果来看,通义千问-Max 得分追平 GPT-4 Turbo,是国产大模型首次在该基准上取得如此佳绩。

去年 8 月,通义更是率先加入开源行列,沿着「全模态、全尺寸」开源路线陆续推出了数十款模型。

例如,通义千问最新推出的开源模型 Qwen2-72B 在模型匿名 PK 的中文大模型竞技场 Compass Arena 上,Qwen2-72B-instruct 以 1090 的总分取得国产大模型最高分,总分仅次于 GPT-4o。

在国际开源社区 Hugging Face 组织的 Open LLM Leaderboard 模型测评中,Qwen2-72B-instruct 再度登顶,力压 Llama-3、Mixtral、Phi-3 等海外模型。

HuggingFace 联合创始人兼 CEO Clem 发文表示:「Qwen2 是王者,中国在全球开源大模型领域处于领导地位。」

大模型的训练和迭代成本极高,绝大部分的 AI 开发者和中小企业都无法负担。

基于这样的背景,百炼大模型平台在今年 5 月全面升级为阿里云承载云+AI 能力的重要平台,提供一站式、全托管的大模型定制与应用服务。

在这里,开发者 5 到 10 行代码即可快速构建 RAG 应用,让大模型拥有「最强外挂」。

在模型服务上,阿里云百炼同样坚持打造开放生态。

目前,百炼平台集成了上百款大模型 API,除了通义、Llama、ChatGLM 等系列,还首家托管零一万物、百川智能等大模型,覆盖国内外主流厂商,联动魔搭开源社区,还支持企业上架通用或行业模型,给开发者提供足够多样化的模型选择。

为了最大程度降低模型使用门槛、加速 AI 应用爆发,5 月 21 日,通义千问系列模型大幅降价,GPT-4 级主力模型直降 97%,低至百万 tokens 仅 0.5 元。

周靖人强调,阿里云会将坚持拥抱开源开放,打造一朵「AI 时代最开放的云」。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿|原文链接· ·新浪微博