AIGC的发展,将使得知识性与创造性工作的边际成本降至0,从而产生巨大的生产效率和经济价值,每一个需要我们原创的领域都或多或少将有AI的参与。AIGC 的产品形态未来会是什么样的呢?它的细分机会又在哪里?本文作者对此进行了分析,一起来看一下吧。
本文核心观点来自红杉在 9 月发布的一篇文章《Generative AI: A Creative New World》,我按大白话翻译并做了删减和补充。
原文想要表达的意思是——“随着 AIGC(AI Generative Content)变得更快更强以及更低成本,在某些程度上将比人类手工创作得更好,AIGC 将使得知识性与创造性工作的边际成本降至 0 ,从而产生巨大的生产效率和经济价值,它将有潜力产生数万亿美元的经济价值,这些领域不限于社交媒体、游戏、广告、建筑、设计、法律、销售以及营销,每一个需要我们原创的领域都或多或少将有 AI 的参与。”
原作者将 AI 模型的发展划分为四波浪潮:
1)2015 年以前,小模型占优
小模型在当时被认为是最优选,它们擅长分析任务,并应用在各类预测和欺诈分类的工作上,但是这些模型对通用任务的处理表现并不好,想要让 AI 输出人类水平的内容或者代码是不可能的。
2)2015 年至今,大模型发展
Google Research 在 2017 年发表了一篇里程碑意义的论文《Attention is All You Need》,通过被称为 Transformer 的神经网络架构来生成高质量的语言模型,同时提高了并发处理能力,降低了训练时间,这些模型可以容易地针对特定领域进行定制。
随着这些 AI 模型变得越来越大,开始提供人类水平的处理能力。在 2015 年~2020 年期间,这些模型的计算量提高了 6 个数量级,这意味着在输出结果上超过了人类在书写、语音、图像识别、阅读和语言理解上的基准。
Source:公开网络
2020年 5月,OpenAI 推出的 GPT-3 模型从中脱颖而出,相对于此前的 GPT-2 是一个巨大的飞跃,它的参数量是前代的百倍之多,达到 1750 亿个参数量, GPT-3 能通过输入的自然语言判断和生成我们想要的内容,从某种意义上说它更像人类了,但是该模型并没有人类那样的价值观和约束,只是在形式上依靠庞大的数据量和更优的算法更加接近人类智能。
当然,这类模型取得了研究上的进展,但离商业普及仍然有一段距离,无非是部署起来成本高,存在诸多方面的商业化限制。
3)2022年开始,多快好省
2022 年开始至今的数月,AIGC 的发展可以说是超预期的,先是去年 10月一名叫 Somnai 的工程师在 Github 上发布了名为 Disco Diffusion 的 text2img (文本到图像)项目开始走红网络,再是今年 4 月 OpenAI 发布了 DALL.E 2 模型,一款融合了艺术家达利+机器人瓦力能力,能够生成高度逼真的原创图像的模型。
再到 5 月,Google 推出了在精度和质量上更出色的 Imagen 模型,7 月原 Leap Motion 联创 David Holz 的项目 Midjourney 开始走进大众视野,例如少楠的《产品沉思录》近期的封面创意就来源于此,还是宫崎骏风味的:
Source:shaonan with Midjourney
接下来是 8 月 Stable Diffusion 项目开源,Stable Diffusion 项目带来的主要革新是大幅降低了模型对内存和计算的要求,举个例子,原先 512 x 512 对图像一下子变成了 64 x 64,需要的内存减少了 98%!这就像是在上世纪把一台 Eniac 计算机塞到了乔布斯的 Apple II 个人电脑里,这种普及为技术的商业化提供了合适的条件。
Stable Diffusion 的革新或许刺激到了资本们敏锐的神经,今年以来 AIGC 的概念也是非常火,感兴趣的朋友可以访问我近日写的这篇《从 Stability AI 和 Stable Diffusion 看 AIGC》展开阅读。
4)当前,杀手应用的养料
就像是 4G 移动网络的成熟,千元机、网络速度提升以及网络资费下降,让大众进行短视频内容消费成为可能,随之出现的一波短视频&直播创业中杀出了抖音和 Tiktok,在 AIGC 领域预计或许也会出现这样的押韵,甚至也会有平台的出现,但红杉认为这个机会还是比较小的,更偏向于垂直应用。
AI 不仅影响业务和行业层面,按照技术语言叫多模态,按照大白话就是文字、代码、声音、图像、视频、3D 模型以及其它基础性载体,如生物化学分子等产生碰撞,这些不同的内容载体在更好的 AI 模型加持下,产生质量更高、容量更大、领域更垂直以及更创意有趣的市场机会。
Source:Sequoia
如果把这些参数量和晶体管对照,将大模型对照成 AI 领域的摩尔定律,红杉美国的观点是在 2025 年及以后看到较为成熟的商业化案例。
以下是红杉观察到的几个场景案例供参考:
AIGC 的产品形态未来会是什么样的?以下是红杉的预测:
1)关于模型
AIGC 的产品构建在 GPT-3 或者 Stable Diffusion 等大模型上面,并且随着产品的应用以及用户数据的增长,将会反过来促进模型的优化:
2)关于产品
部分 AIGC 产品将作为现有软件生态系统中的插件存在,融入在 IDE、Figma 和 Discord中,例如 Midjourney 就一款依托于 Discord 的文本到图像创作工具,另外还有少量以独立形态存在的产品,例如:
从现有的软件生态以插件形式存在,然后独立出来或许是一个冷启动的好方式,红杉表示已经在消费和社交领域观察到这种策略的成功。
3)关于交互
当前许多 AIGC 的 Demo 产品几乎是一次性完成的,即用户输入内容,模型输出结果,这些结果可以自动保存,又或者放弃重新生成,模型也在持续迭代,用户也可以将模型生成的结果进行进一步编辑、优化或二创。
今天,AIGC 的结果可以被用在原型或初稿制作中,这类产品很擅长将不同的创意点子融入其中,以推进整个创作过程,例如在建筑设计领域或者平面设计中起草各种 Logo 方案,然后由用户来做进一步“精修”。
随着模型越来越聪明,并积累了使用者越来越多的数据,这些原型或初稿也将越来越完善,直到缩短整个创作周期,甚至被作为成品。
4)关于品类
最好的 AIGC 公司通过打造用户使用数据与模型性能之间的飞轮来持续建立竞争优势。初创企业想要赢得这一胜利,必须建立这样的商业模型:
这样的商业模型将会诞生在比较垂类的市场中,比如代码、设计或者游戏,而不是妄想做个大产品,什么群体都想服务。最好的切入方式还是在一些现有的应用体系中深嵌来得到增长,然后通过原生的 AI 方式慢慢替代落后的服务流程,当然积累数据和用户是需要花时间的,相信这是一种行之有效的增长策略。
最后,红杉在文章中提示—— 虽然 AIGC 具有很大的潜力,但是就当前而言还有很多商业模式和技术上的问题没有解决,例如在版权、隐私安全和成本等方面。
总的来说,AIGC 还处在一个早期阶段,平台层的发展还不错,应用层还有很大的发挥空间;需要澄清的是,用户并不需要一些大的语言模型来长篇大论写一篇托尔斯泰式的小说,现有的模型已经足够创作一些博客初稿了,后期还有很多可以被释放与创造的价值。
第一波 AIGC 的产品犹如 iPhone 刚刚诞生的那样,充满噱头但还没有明确的商业模式和差异价值,虽然我们能从现有的产品和技术中对未来管中窥豹,例如刷到一些 AI 生成的精美图片。
最后,谈一点个人理解,这里的机会可能是模型在某个垂类上的内容供给效率高于当前人类工作人员的效率才会出现,就像推荐算法当初改变了传统的内容和商品分发效率那样,但就当前而言还不会有一个通用大模型一招吃遍鲜去生产所有各种形态的内容、脚本、方案、配方、公式、素材等等。
Reference:
[1] 《Generative AI: A Creative New World》,Sequoia
免责声明:在任何情况下,本文信息或表述,不构成任何投资建议;若有侵权,请后台联系删除。
作者:TimJ;来源公众号:江天Tim
本文由 @江天Tim 原创发布于人人都是产品经理,未经许可,禁止转载
题图来自 Unsplash,基于 CC0 协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。