通义千问中文性能是否匹敌GPT-4？大模型开源与闭源辩论激烈

发表时间: 2024-05-10 17:43

在通义大模型发布一周年之际，阿里云再度公布新进展。5月9日，阿里云举行了阿里云AI峰会—北京站，正式发布通义千问2.5，据悉，该模型中文性能全面赶超GPT-4 Turbo。同时阿里云还公布，通义千问1100亿参数开源模型在多个基准测评收获最佳成绩，超越Llama-3-70B（meta的模型），成为开源领域最强大模型。
据介绍，北京站只是阿里云举办相关峰会的其中一个地点，接下来还会巡回在多个城市举行，并在每个城市邀请多个已应用阿里云相关模型的企业做分享。此次在北京站现场，小米、新浪微博等负责人出席分享。
南都记者关注到，在本次峰会中阿里云多番强调近期备受业界关注的大模型开源问题。阿里云方面认为，开源能把生态做强。目前国内的大模型头部厂商中，除了阿里云外，还有商汤、智谱AI、零一万物等厂商发布的大模型都选择了开源。
不过，据公开报道，百度创始人、董事长兼首席执行官李彦宏此前在一次内部谈话时表示，模型开源并不是一个“众人拾柴火焰高”的情况，这跟传统的软件开源不一样，闭源才有真正的商业模式，才能持续领先，才能聚集人才和算力。

最新版本通义千问中文性能追平GPT-4？

5月9日，阿里云方面透露，2023年4月问世以来，通义千问从初代模型升级至2.5版本。相比此前的通义千问2.1版，通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%，中文能力更是持续领先业界。根据权威测评结果，通义千问2.5得分追平GPT-4 Turbo。

不过，南都记者关注到，4月25日OpenAI联合创始人兼首席执行官萨姆·奥尔特曼在斯坦福大学发表演讲时表示，GPT-5将比GPT-4智能很多，不过OpenAI仍保持闭源决策。

除此以外，大会当日阿里云还宣布，原通义千问APP更名为“通义APP”。据悉在这一年间，通义已发展出了业界领先的文生图、智能编码、文档解析、音视频理解等能力，企业客户和开发者可以通过API调用、模型下载等方式接入通义，个人用户可从APP、官网和小程序免费使用通义。

阿里云透露，目前通义大模型通过阿里云服务企业超9万，通义开源模型累计下载量突破700万。通义落地应用进程加速，现已进入PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。

大会上，阿里云还宣布通义灵码推出企业版。通义灵码是国内用户规模第一的智能编码助手，2023年10月发布至今，通义灵码的插件下载量已超350万，每日推荐代码超3000万次，被开发者采纳的代码超亿行，是国内最受欢迎的智能编程助手。

在阿里云当天的大会上，通义还发布了1100亿参数开源模型Qwen1.5-110B。据透露，通义多模态模型和专有能力模型也具备业界顶尖影响力。在多个多模态标准测试中，通义千问视觉理解模型得分超越Gemini Ultra和GPT-4V，这款模型已在多家企业落地；代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的榜首模型。

阿里云反复强调开源能做强“生态”

目前，大模型的开源与非开源正在成为业界讨论的焦点。南都记者了解获悉，开源后模型的源代码、模型数据和模型训练的过程等内容都是公开可用的，这些模型可以供使用者下载、使用、修改、分享和重构。大模型极高的训练和迭代成本，让目前绝大部分的AI开发者和中小企业都无法负担，而开源则可以降低模型的二次开发门槛，有助于加速大模型应用的落地。

目前，大模型行业也正在形成两派。最先让AI走入普通人生活的OpenAI，经历了GPT-2开源、GPT-3仅公开论文、GPT-3只发布技术报告的时段，已越来越有非开源倾向。据悉，5月初在麻省理工学院与校长科恩布鲁斯探讨相关问题被问及OpenAI的闭源决策时，OpenAI联合创始人兼首席执行官萨姆·奥尔特曼对“闭源之问”选择了含糊回答的政策，并表示OpenAI已经提供了免费的AI工具——GPT-3.5了。

另一方面，以Meta为代表的大模型厂商也推动了一股大模型开源风潮。去年8月，通义也宣布加入开源行列，并沿着“全模态、全尺寸”开源路线陆续推出十多款模型。据阿里云方面透露，目前通义开源模型下载量已经超过700万。南都记者关注到，目前在多家国内大模型头部厂商中，商汤、智谱AI、零一万物等厂商发布的大模型都选择了开源。

在大会中，阿里云首席技术官周靖人反复提到了“生态”二字，这个“生态”就由模型开源来造就。他表示，阿里云认识到今天这样一个时代“生态”的重要性，“大模型的发展离不开整个生态，不单单是通义本身的发展，我们更希望今天能够把AI技术发展的能力，赋能给企业和开发者，能够让大家更快地推进AI技术一系列的创新和发展。”由此通义一直在坚持开源。

在接受媒体群访时周靖人也表示，模型之上的应用和创新非常多，不能仅仅局限于使用某一款闭源的框架或者说只能对接某一个形式。在他看来，不管在PC端还是手机端，大模型可以适配各种各样的场景，能够快速搭建更加复杂的业务，而这需要一个非常开放的开源生态去对接。

大模型的开源除了能加快模型落地应用，也可以反哺到模型本身的迭代升级中。模型开源后，在开发者社区的驱动和改进下，模型确实有可能获得更好的迭代。目前阿里云就有一个名为魔搭的开发者社区，据悉魔搭社区的开发者用户数已超过了500万。

“在大模型场景下开源是最贵的”

不过，在一些坚持闭源逻辑的厂商看来，开源大模型后开发者的参与对大模型迭代帮助不大。据公开报道，百度创始人、董事长兼首席执行官李彦宏就在2024百度AI开发者大会上发表主题演讲时表示，“在大模型场景下开源是最贵的。”李彦宏在现场结合文心大模型的实践给出解释：“开发者通过文心4.0降维裁剪出来的更小尺寸模型，比直接拿开源模型调出来的模型，在同等尺寸下的效果明显更好；同等效果下，成本明显更低。”

根据公开报道，此前李彦宏还在一次内部谈话时表示，模型开源也不是一个“众人拾柴火焰高”的情况，这跟传统的软件开源，比如Linux、安卓等很不一样。而百度要开源还得自己去维护一套开源的版本，这并不划算；闭源才有真正的商业模式，才能持续领先，才能聚集人才和算力。

月之暗面创始人杨植麟也认为“开源追不上闭源”，在接受媒体采访时杨植麟曾表示，闭源是一个对市场的整合，会有人才聚集和资本聚集，最后一定是闭源更好。“如果我今天有一个领先的模型，开源出来，大概率不合理。反而是落后者可能会这么做，或者开源小模型，搅局嘛，反正不开源也没价值。”

不过，与李彦宏、杨植麟不同，周鸿祎在第二十七届哈佛中国论坛上就表示自己“相信开源的力量”，“一句话，今天没有开源就没有Linux，没有Linux就没有互联网，就连说这话的公司自己都借助了开源的力量才成长到今天。” 周鸿祎还表示，开源社区聚集的工程师和科学家的数量是闭源的数百倍。所以今年开源大模型只做了一年就已经超过了GPT-3.5的能力。他认为，未来一两年内，开源的力量很有可能会达到或者超过闭源的水平。

值得一提的是，阿里云除了在布局开源模型，也在布局自己的闭源模型。在大会结束后接受媒体群访时，周靖人表示，“实际上（我们）形成的是一个开源和闭源的整体体系，我们希望把这些选择能够让我们的企业、开发者来做自主的、没有担忧的选择。”

杨植麟对此也曾表示，其认为开源和闭源接下来在大模型领域里会是互补的关系。“开源可以支持开发者去尝试各种创新的应用，而且在开发过程中可以对数据、训练过程、环境部署等合规性有更高的要求，场景也会更灵活。而闭源的话也会有自己的价值，比如说像未来的很多超级应用的入口，不管是生产力端还是娱乐消费端，都会有以闭源为核心的超级应用出现。这两种不同的模型其实是一定程度的互补，而不是冲突的关系，如何取舍其实是看每个公司不同的策略。我们（月之暗面）的策略是希望去打造超级应用，这是我们目前专注的地方，所以会把时间都花在上面。”

采写：南都记者林文琪

通义千问中文性能是否匹敌GPT-4？大模型开源与闭源辩论激烈

热门阅读

推荐阅读