AIGC产业在近一段时间来引起了用户们的广泛关注,一方面,AI绘画热潮的兴起将这一概念捧上了台面,另一方面,AIGC产业的兴起也呼应了在互联网圈里“打得火热”的元宇宙概念。那么,如何解读AI绘画、AIGC的商业前景与目前发展?不如来看看作者的解读。
“试了一千遍,终于成功驯服AI。”近日,从朋友圈到小红书到抖音的各大平台上,都掀起一阵AI绘画的热潮。免费体验、生成速度快,这些优点一定程度上弥补了AI出图质量层次不齐的弊端,反而带来了“开盲盒”的新鲜感。
从AI画作《太空歌剧院》获奖开始,AI绘画不断获取新的关注,但在大众视野内都没有激起什么浪花。今年8月,Stability AI方在GitHub上开源了Stable Diffusion模型的所有代码,一时间引起各方二创二改,AIGC产业迎来了一轮新的“春天”。
AIGC,全称为AI Generated Content,即一种基于人工智能技术自动生成内容的新型生产范式。继 PGC(专业生产内容)、UGC(用户生成内容)之后,AIGC成为生产方式新的趋向与潮流。目前互联网体系及技术尚不足AIGC全面应用,因此当下AIGC多用于辅助人工生产内容,作为PGC、UGC有益的补充。AI绘画,就是AIGC的一个分支。
AIGC并非新鲜的概念。早在20世纪50年代,就出现了AIGC的小范围实验;19世纪末20世纪初则逐步向实用性、落地性过渡。随后,相关技术与模型迅速发展,推出了从音频到图片、视频等多领域多模态的AIGC产品。
AIGC的迅猛发展,首先得益于深度学习技术模型的突破。2014年,业内提出GAN生成对抗网络算法模型,通过AI内部生成、判别两套模型进行迭代训练,从而根据输入的信息生成新图像。GAN学习模型具有一定突破性,主要利用既有图片进行“缝合、迁移”,但生成图片可控性弱,彼时仍停留在较为生硬的AI风格。
随后,AI作图界陆续出现了DALL-E、CLIP、Disco Diffusion、Midjourney、DALL-E2、Stable Diffusion等模型,不断完善文本转图像模型,也逐步产生了提升图片原创度、艺术性、渲染速度;带来一阵AI绘画质量的飞跃。网友纷纷感慨几个月前还在嘲笑AI出图模式化,如今已经真假难辨了。
真正带动AI绘画狂潮的,还是Stable Diffusion模型的开源。Stability AI以“AI by the people, for the people”为理念,开源作图模型Stable Diffusion后也立刻吸引了业内外人士。
Stability AI的开源带来了英文环境AI模型的遍地开花,然而,在引入并国产化的过程中,也出现了高低语境国家文化差异的障碍。如果直接基于英文Stable Diffusion翻译进行研发,在某些语境中AI的语义理解会产生较大的出入。
开源,开卷。尤其今年是AI绘画的大火时段,大大小小的公司都涌入这个赛道。大厂陆续布局,小公司和个体也纷纷参与到这场AI界的狂欢。
国外顶尖技术公司以Google、Facebook、Meta几大巨头为主,更兼有掌握Stable Diffusion模型的Stability AI、掌握DALL-E2模型的Open AI等几家新兴独角兽企业。几家公司在相关领域的迭代速度非常快。2017年,Google开源一个AI简笔画应用;同年Facebook发布CAN创造性对抗网络模型。2021年,OpenAI又相继发布DALL-E模型、CLIP模型;而2022年界内更是爆发出各路新模型,整个赛道呈现高速增长的状态。
国内互联网大厂也相继部署AIGC方向的业务板块。从语音到数字人,从小冰诗集到AI绘画,AI无疑成为了近年的“顶流”。
然而有些出人意料的是,比起深入研发,AI绘画在国内最大型出圈却是流量路线的快车道。
百度作为国内互联网巨头,近年深耕智能云发展,依托飞桨、文心大模型的技术基础,推出首款AI作画产品“文心一格”。腾讯基于自身用户社群覆盖度,推出QQ小世界AI画匠,利用分享效应并制造部分话题点形成借力传播。抖音作为主打短视频社交的公司也推出了AI绘画特效,也算借热度发挥进行了一波平台外宣。总体而言,还是基于降低门槛、社交路线的策略。
与AI绘画相关的微信公众号、小程序近期不断涌现。有大公司,小公司、个体研发也不罕见。9月,意间AI绘画大火,也带动中文AI绘图界不断迭代。中科闻歌旗下的翰墨丹青、触手AI等在中文AI绘画产品上都有不错的用户声誉, 6pen、Draft、灵境AI等国内团队研发的产品也收获一众访问量。
用户在选择AI绘画应用时,最注重的点首先是产品质量,即AI的语义理解、出图质量,而这些指标直接关涉到算法模型的优化程度。大厂和巨头在模型优化上无疑占据制高点;但开源项目也弱化了这一技术隔膜,直接促成了AI绘画应用“遍地开花”的局面。
AI绘画无疑呼应了“元宇宙”这个近年最火的市场热点。且不论是发展大方向还是泡沫,未来的元宇宙产业都为AIGC提供了精准的适配场景,并助力形成商业的闭环。举例而言,数字人需要配套的智能语音系统、皮套绘制、动态设计等,在AIGC相关技术相对成熟后,利用其可能达到事半功倍的效果。
作为可视化的工具,AI绘画在整个AIGC产业链中占据重要的一环。回应Web3.0提出的更多体系化需求,AIGC在多年的发展中基本涉及了各大领域,形成一套环环相扣的细分赛道。根据AI技术场景,功能上涵盖了文字、音频、图像、视频等多方位内容生成技术,也从传媒、影视、教育、金融等多个领域切入带来新生产力。
然而上述AIGC大有可为的前景更多都存在于“未来”。当下在对其布局的同时,要警惕对AI绘画过度吹捧形成的“泡沫”。AIGC喝彩声一片,然而更多仍是“概念破圈”,对C端用户来说可能只意味着“昙花一现”的网红体验品。国内的模型训练与产业链尚不成熟,没有非常“拿得出手”的竞品,最出圈的反而是“AI翻车实例”这类流量型产品。
而国内的AI智能产业多半围绕实体经济布局,如阿里巴巴新零售、百度自动驾驶、华为AI芯片等;围绕AI绘画等模块保持关注但尚不深入。百度此次推出的“文心一格”AI绘画产品,就增加了出图在商业应用场景的预览;表明大厂也在谋求AI绘图从ToC端体验到ToB端商业化的转型。借助这波流量与关注度,尽早围绕实际商业环境与需求开展部署,才能在似真似幻的欢呼声中走好下一步棋。
作者:肖奕佳
来源公众号:镜象娱乐(ID:jingxiangyuler),洞见产业另一面。
本文由人人都是产品经理合作媒体 @镜象娱乐 授权发布,未经许可,禁止转载。
题图来自 Unsplash,基于 CC0 协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。