每经记者:李少婷 每经编辑:魏官红
4月17日,昆仑万维(300418.SZ,股价40.93元,市值497.3亿元)官宣“天工3.0”基座大模型与“天工SkyMusic”音乐大模型正式开启公测,前者为千亿级参数开源模型,后者为AI(人工智能)音乐生成大模型。
就在前一天(4月16日)上午,百度创始人、董事长兼首席执行官李彦宏在Create 2024百度AI开发者大会上直言“开源模型会越来越落后”,并推出三大AI开发工具,称“人人都是开发者”。
开源和闭源的选择是大模型领域的热点话题,OpenAI的GPT-4模型就是采用闭源模式,微软则开源了WizardLM-2。国内,百川智能、智源都是开源的支持者,通义千问亦有开源,而华为盘古大模型则坚定选择不开源。模式之争的背后,是关于如何平衡技术创新、商业利益、社区参与和市场竞争力的讨论。
但业内共识也愈加明确,AI必将掀起创造力革命,在技术普惠与文化平权等多个方面,推动社会的发展。
“音乐界ChatGPT”Suno V3正冲击着音乐界,以至于音乐人小柯调侃自己要失业了。尽管人工智能文生音乐的艺术水平尚待观察,但一个不争的事实是,创作音乐的门槛大大降低了。
在人们还在讨论Suno如何赚钱时,昆仑万维发布了AI音乐生成大模型天工Skymusic。4月16日下午,在闭门沟通会上,昆仑万维董事长兼CEO方汉向《每日经济新闻》记者表示,Skymusic会一直保持对C端免费提供服务。
方汉认为,AIGC(生成式人工智能)可以促进生产力差距的缩小,在全世界范围内打破垄断,实现“文化平权”。
“在尼日利亚拍摄一部电影的成本大概是2万美金,当地生产力太落后了,没有能力去制作一个好的电影作品跟强势的欧美文化去‘对抗’。”方汉表示,欧美的强势文化能在全世界流行,本质上还是通过大投入来创作好内容,而借助AI,全世界范围内的人都可以进行低成本地创作。
推动平权与普惠,是本轮人工智能技术浪潮在社会增益上树起的旗帜。
李彦宏在Create 2024百度AI开发者大会上发表的演讲主题是“人人都是开发者”,他指出,“AI正在掀起一场创造力革命,未来开发应用就像拍个短视频一样简单,人人都是开发者,人人都是创造者”。
李彦宏表示,百度作为一家技术公司,角色定位就是尽可能为大家提供所需的开发工具,提升社会创造力,百度提供了1个强大的基础模型系列和三大AI开发工具,它们组成了一个工具箱,支持开发者打包带走,随取随用。
“过去,开发者用代码改变世界;未来,自然语言将成为新的通用编程语言,你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。”李彦宏说。
李彦宏在4月16日的活动上直言“开源模型会越来越落后”,其实,这也并非是李彦宏头一次表达对开源模型发展路线的否定。
不久前,李彦宏在一次内部讲话中阐述了百度为何不选择开源路线——闭源,是有真正的商业模式的,是能够赚到钱的,能够赚到钱才能聚集算力、聚集人才。
李彦宏认为,大家以为开源是免费的,在成本上有优势,但其实闭源在成本上反而是有优势的,只要是同等能力,闭源模型的推理成本一定是更低的,响应速度一定是更快的。
Create 2024百度AI开发者大会上,李彦宏强调,通过文心4.0降维裁剪出来的更小尺寸模型,要比直接拿开源调出来的模型,同等尺寸下效果明显更好,同等效果下,成本明显更低。“大家以前用开源觉得开源便宜,其实在大模型场景下,开源是最贵的。所以开源模型会越来越落后。”
闭源模型更具优势的成本是李彦宏论断的基础:相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。也就是说,客户原来一天调用1万次,同样成本现在可以调用100万次。
但方汉并不认可这一说法。“开源大模型跟闭源大模型的差别其实是在缩短。”方汉援引业内评测机构数据称,2023年到2024年这一年间,开源大模型与闭源大模型之间的差距,已经从落后2年以上进化到落后只剩4至6个月以内。
在方汉看来,开源的商业模式仍然是存在的,开源本身实际上是最便宜一种PR(公共关系)手段,是获得销售线索最重要一个手段。
“我们认为开源大模型实际上是一种生态的构建器,更利于满足用户的长尾需求。”方汉认为,开源大模型跟闭源大模型是一个生态的组成部分,不能说谁压倒谁,而是都有自己的生存空间,也都有更好的明天。
“推理成本是两头驴在拉磨,一头驴是在不断提升它的能力,一头驴是在不断降低它的成本。”对于推力成本的下降情况,方汉向《每日经济新闻》记者表示,如果纯从推理成本效率上来看,几乎每年以10倍的比例在往下减,但是同时其模型能力也在数十倍往上提升。所以总的推理成本是在下降的。
每日经济新闻