蒋涛谈AI开源平民化:轻松创造专属应用

发表时间: 2024-06-20 16:54

创造软件将不再受编程语言能力约束,创造和使用软件的方式将发生巨大的改变。

整理 | 王启隆

出品丨AI 科技大本营(ID:rgznai100)
GitHub CEO Thomas Dohmke 曾在今年的 TED 演讲上分享了他通过 AI 编程开发的一款专属应用,用来记录他一生中乘坐的所有航班。他自己吐槽说这是一款无聊的应用,但这却是属于他自己一个人的 App,且整个开发过程仅用自然语言完成,只花了喝一杯酒的时间。
Thomas 紧接着强调:“不久之后,每个人都能像我一样,开发出专属于自己的 App” 这句话的“每个人”并不是指“每一名程序员”,而是世界上的“每一位普通人”。
这一切,并不是仅靠 OpenAI ChatGPT 的驱动,而是与紧随其后的开源 AI 浪潮息息相关。如今开源 AI 大模型层出不穷,不仅有企业巨头 Meta 开发的 Llama,还出现了法国独角兽 Mistral、马斯克谋划已久的 Grok、英伟达最新开源的 Nemotron、登顶 Hugging Face 的国产阿里云 Qwen2……开源的风吹进了千家百户,让每个人都能享受到这场正在进行的 AI 革命
作为国内最早推广开源文化的技术社区,CSDN 团结了我国最早的一批开源贡献者与数千万华人开发者,历经了移动互联网时代和云原生时代两大变革。如今面对 AI 技术的迅猛发展,CSDN 创始人、总裁蒋涛在北京智源大会的“AI 开源”分论坛上带来了自己的思考与观察,以开发者的视角总结了当前开源大模型时代的范式变化AI 应用爆发趋势,观点提炼如下
  • 我们正从程序员的“2G 时代”进入真正的智能时代,即所谓的 3G 时代。随着大模型在本地设备上的运行,对应的“4G 时代”也将加速到来,AI 应用产生巨大爆发。

  • 开源和闭源的工具在不断涌现,AI 技术生态的演进速度是过去云计算的十倍以上。每一次新技术带来范式的转移,应用的渗透速度都会加倍

  • 智能体(Agent)写代码只是临时的热点,未来智能体将彻底改变人机交互的方式,我们身边的每一个设备都会智能化

  • 所有的电脑用户都将能够从零开始开发小型软件工具,创造软件将不再受编程语言能力约束,创造和使用软件的方式将发生巨大的改变。每个人都可以创作数百个专属应用,每家企业都可以拥有专属个性化应用市场

以下为演讲全文整理:

AI 大模型是一场新生态革命

我从事编程很多年,经历了行业的很多演变周期。但这两年我发现,我们其实原本处于程序员的“2G 时代”,现在才开始进入真正的智能时代,即所谓的 3G 时代。

CSDN 在这些年里积累了超过 5300 万的注册用户,每天新增约两万用户。如今全球开发者数量持续增加,根据 GitHub 截止到 5 月份的数据,全球开发者数量达 1.32 亿,增长了 30%。而在中国,每年新增开发者数量达到七八百万,几乎与我国的大学生数量持平。

我们有一半的用户同时使用 CSDN 和 GitHub,但是我们中国也需要自己的GitHub,因此 CSDN 在 2020 年开始建设 GitCode 项目,去年与华为进行战略合作,底层使用华为的 CodeArts,上层面向中国开发者提供服务。

此外,我们也举办一些深度的技术大会,比如今年 7 月很快会在北京开启一场全球软件研发技术大会,探讨的主题和这篇文章一样:在开源大模型时代,软件研发将发生什么变化

计算范式的变化

首先是底层计算范式的变化。今年 6 月份高考的时候,我曾听北大计算机系的陈忠教授建议“不要选择计算机专业,因为冯诺依曼架构已不再是主流”,现在连教材都还来不及换。AndreJ Karpathy 在 2017 年曾提出了软件 1.0软件 2.0 的概念,标志着我们程序员从通过 if else 等规则解决问题,转变为神经网络自学习解决问题。

图片来源:Andrej Karpathy “Software 2.0”

过去我们做的是确定性的、规则性的计算,研究结构化的数据串行如何执行;但神经网络的计算是不一样的,它需要向量和并行,它计算的是下一个词出现的概率(next-word prediction),充满了不确定性。这里有个经典的类比:我们相当于从经典物理时代进入了量子物理时代

开发范式的变化

大模型的出现带来了开发工具的巨大变化,此前被视为没什么机会的云计算也在不断演变。比如 CoreWeave,这家公司是做加密货币挖矿起家的,后面被英伟达投资了 80 亿美元专门做 GPU 算力;而在中国,前阿里巴巴副总裁贾扬清创办的 Lepton AI 就是云原生 AI 平台,专门做推理服务。这些案例体现了基础设施的革新。

围绕模型训练和生成式工具,各种新技术和工具链不断涌现,并且大部分都是开源的。开源项目的发展速度非常快,例如 Meta 的 Llama 项目虽然不到一年时间,但其生态项目的 Star 数已达 24 万,而 Kafka 和 Spark 做了十几年也只有其五分之一。AI 技术生态的演进速度,是过去云计算的十倍以上。我们原先是以半年为单位来学习技术的最新动向,现在则需以周为单位学习。

图片来源:Sapphire Ventures

此外,作为 AI 大模型的驱动者,OpenAI 如今收入达到了非常惊人的 34 亿美元(去年是 20 亿),它也是史上最快达到一亿用户的公司。据最新统计,OpenAI 的独立访问用户已经超过 6 亿。

对开发者而言,AI 带来了编程范式的变化,开发从本地化走向云化,再到 AI 化,最终借助大模型赋能实现了平民化新的工具链不断涌现,帮助开发者编写、测试甚至 Review 代码。GitHub 此前推出了 Copilot,并结合 Workspace,让 AI 可以随时在写代码的过程中提供帮助。这也解决了开发人员面临的最大障碍 —— 将想法转化为详细规范。

但现在,我们也面临许多严峻的挑战。

例如,我去年在注册 GitHub Octoverse 大会的时候发现居然没有中国选项,这也是我们开发 GitCode 的原因之一。此外,编辑器也在发生变化,比如 OpenAI 投资的 Cursor AI 可以在写代码时无缝集成 AI 助手,提供了极大的帮助。

未来的编程方式将更加智能化,AI 助手将无处不在。当前大量工具仍由欧美公司掌握,但我们也在积极发展自己的工具链,比如华为、智谱和智源等公司都在努力,相信 AI 带来的机会对中国的公司和大模型厂商是一个巨大的机遇期

这一点可以类比汽车领域:德国、日本曾在燃油车领先了很多年,中国想追上传统燃油车几乎是不可能的,但是我们在电动车领域就实现了很好的超越。所以工具链也是如此,我们很难追赶 20 年的差距,但可以从 AI 编程入手。

我们的调查显示,AI 编程工具的使用率和留存率非常高,48.6% 的开发者每天使用 AI 编程工具。GitHub Copilot 是世界上最领先的工具,占有率却只有 28%,这有点类似于电动车领域里特斯拉的地位。而阿里的通义灵码等国产工具表现不错,使用占比 25.5%,国产化程度达到了历史新高。此外,付费意愿值得一提,有 71.8% 的中国开发者愿意为工具付费。

未来可能是智能体(Agent)开发的时代,写代码只是临时过程,更多的智能体将帮助开发者完成工作。例如,前段时间爆火的「Devin」就号称“的第一个 AI 软件工程师”。总之,开源和闭源的工具在不断涌现。

交互范式的变化

随着用户与开发工具的变化,应用也会随之改变。每一次的技术转型同样会带来应用的类型变更,如今从 GUI 图形交互转为自然语言交互,应用形态正在发生变革。

我们总结,从 PC 时代、互联网时代再到移动互联网时代,应用的渗透速度都会加倍。如今进入生成式 AI 的应用时代,会用更短的时间完成范式的转移

人工智能的大模型时代并不是从 2022 年底才开始的,前面有很长的积累期,正如我开头提到 2G 时代将过渡到 3G,可能马上就会进入 4G 的加速时代。如果大模型未来能够在我们的本地电脑上很好地运行(苹果已经在今年 WWDC 2024 大会上演示了 iPhone 上的 7B 模型),会带来应用的巨大爆发。

创造软件将不再受编程语言能力的约束

应用将如何实现爆发呢?我们总结了三个关键点:行业应用 AI 化、终端应用服务化和应用行业可塑化

行业应用 AI 化

我曾提出过一个观点:大模型新时代,人人都是开发者、行行知识炼模型。每个行业都应该有自己的行业模型,基于自身的知识和数据,推动全行业 AI 化。

图片来源:Battery Ventures

此前美国投资机构 Battery Ventures 整理过法律领域的 AI 应用点。可以看到,光是法律领域,每个点都可以独立做一个模型,如专利 Review、合同 Review 等等。同样的情况在 AI 营销工具中也出现了,包括 SEO 和内容生成工具。

终端应用服务化

目前主流的交互方式还是依赖点击和键盘,但比尔·盖茨先前在他的个人网站发表过观点,他认为智能体将是新的交互方式,智能体会颠覆软件行业,引领自我们从输入命令到点击图标以来最大的计算机革命

在前不久的 WWDC 苹果开发者大会,苹果展示了他们的 Apple Intelligence 如何将 AI 能力无缝集成到其 SDK 中。这对手机厂商和硬件厂商来说是一个非常巨大的机会,AI 将无处不在,从可穿戴硬件到智能耳机、眼镜、运动绑带,甚至是 AI PC。像鸿蒙的 HarmonyOS 搞的多设备联动、荣耀 MagicOS 做的对话实现服务都很好的例子,这些系统的概念中包含了这一点

应用行业可塑化

软件形态将发生重大变化。对大厂和行业巨头来说,AI 应用场景越多,数据越多,机会就越大。硬件厂商也是如此,用户量越多,机会越大。那对个人创业者或小型创业者来说,机会在哪里呢?

我们认为,现在中等规模的公司最难受,而小型个体将迎来很大的机会。

过去,业务人员想快速开发应用,但程序员需要将这些需求翻译成代码,过程中会有信息损失和偏差。现在有了大模型和云原生技术,没有编程能力的人也能写出应用。我们基于这个理念开发了 Inscode 工具通过对话生成代码,发现错误还能自动调试。例如,开会需要海报,现在可以直接让媒体工作人员提取海报信息并存入数据库,而不需要程序员的介入。

此外,InsCode 也提供了国内外主流大模型的推理、微调服务,并通过集成所有大模型 API,帮助开发者快速开发智能应用。

让你的灵感立刻落地:https://inscode.csdn.net/

所以,开发者数量将迎来十倍的增长。这不仅是我个人一直以来的观点,最近 GitHub CEO Thomas Dohmke 也这么认为,他表示 GitHub 用户将在三年内达到 10 亿,而现在是 1 亿。如果每个用户都能通过对话构建软件,软件形态将发生巨大变化。软件不再需要写给很多人用,而是为个人、为我自己定制化服务。

以前,我们需要程序员来帮忙设计和编程,而现在每个人都可以创作数百个专属应用,无需编程能力。普通电脑用户可以让 AI 来创建和执行脚本,进行数据分析或视频编辑等任务;或是通过 AI 创建整个 GUI 应用程序 ,仅执行单个特定任务。

MIT 博士 Geoffrey Litt 曾提出了可塑性软件的概念,我非常认同这个观点,觉得是异曲同工之妙。所谓可塑性,是指未来每个人都可以像改文章一样改造自己的应用,将不同应用程序的最佳部分取出进行软件重组。AI 使得用户和企业能够扩展和修改现有软件适应工作流程,并创作出数百个属于自己的应用,自动化自己的工作流程。

而对于企业来说,现在企业所用的系统大同小异,没有拉开数字化竞争力。但是每个企业有自己的流程与业务特性,这是比较矛盾的。所以,企业能够更多地自行开发软件以满足其定制需求 ,因 AI 让定制软件成本更低。每家企业拥有企业专属个性化应用市场,这是未来我们认为的发展趋势。

中国正处于这样的机遇期,AI 正在改变我们的生产工具、软件和数据基础,中国有机会在这个市场上与美国并驾齐驱。希望与大家一起合作,构建下一代大模型时代的新开发者生态,谢谢!



由 CSDN 和 Boolan 联合主办的「2024 全球软件研发技术大会(SDCon)」将于 7 月 4 -5 日在北京威斯汀酒店举行。

由世界著名软件架构大师、云原生和微服务领域技术先驱 Chris Richardson 和 MIT 计算机与 AI 实验室(CSAIL)副主任,ACM Fellow Daniel Jackson 领衔,BAT、微软、字节跳动、小米等技术专家将齐聚一堂,共同探讨软件开发的最前沿趋势与技术实践。