近日,AI初创公司出门问问通过港交所聆讯,招股在即,拟在港交所主板挂牌上市。这意味着,出门问问有望成为“AIGC第一股”。
在业内人士看来,出门问问此番在港股上市,除了助力其在AI领域快速发展,更体现了国内AI发展取得阶段性成果,有助于鼓舞和启示其他AI企业发展。
出门问问的创业史堪称中国AI发展史的缩影,且每一步都走在科技浪潮的前沿。自2012年创业至今,历经移动互联网时代的语音交互软件时期、AIoT时代的智能硬件时期,并在2020年以业界首个AIGC产品“魔音工坊”开启大模型商业化的新时代。
目前,大模型全球生态在建立完善中,国产大模型加速迭代竞争格局仍未定型,未来行业龙头优势有望扩大,加上资本市场对大模型赛道的关注以及投资情绪上升,更看重在技术、商业化、人才和应用等方面占据主导地位的新锐企业。
出门问问是中国最早布局大模型的AI公司之一,在技术、产品、商业化、组织力、国际化等方面均积累了深厚优势,并凭借“产模结合”的优势,以亚洲AIGC赛道营收最高的实绩,成为业内首家实现盈利的AI企业。
极具远见的创始团队
AI领域先发优势显著
招股书显示,出门问问以生成式AI与语音交互技术为核心,提供AI生成内容(AIGC)解决方案、AI企业解决方案、智能设备及配件,在快速增长的AIGC领域是亚洲能够自建大模型的市场参与者之一。
回顾出门问问自2012年成立至今的发展历程,能够穿越数次AI浪潮洗礼仍屹立于行业前沿,可见该公司穿越行业周期的实力,以及创始团队对于技术的远见。
出门问问创始人李志飞,约翰霍普金斯大学计算机系博士、前Google总部科学家、自然语言处理及人工智能专家,也是世界主流机器翻译开源软件Joshua主要开发者之一。
出门问问创立的2012年,是AI深度学习革命的第一波浪潮前夕,小模型被认为是理解语言的“最先进的技术”,被用于从“预测送达时间”到“欺诈信息分类”等各类任务中。
自2015年推出初代TTS(文字转语音)引擎以来,出门问问通过不断迭代,显著提升了语音合成的真实度。同时,公司开发团队利用文本大模型技术,构建了自己的声音大模型——MeetVoice Pro,即出门问问第六代TTS引擎。
此后,历经生成式AI发展的第二、三波发展浪潮,出门问问团队的技术与商业敏锐度进一步提升。
在2020年6月GPT-3刚推出时,李志飞最早面向大众科普了大语言模型的本质,并于2023年春节赴美“解密”ChatGPT,此后官宣入局大模型,成为最早掀起中国大模型热潮的创业引领者和专家,也成为出门问问推出“序列猴子”大模型的序章。
“序列猴子”是一款拥有除文本之外,还能够生成图像、3D内容、语音生成及语音识别的多模态大模型,其以语言为核心的能力体系,涵盖“知识、对话、数学、代码、逻辑、思维链、规划”六个维度。
出门问问的大模型业务展现出强劲的增长动力,当前AIGC解决方案已吸引约84万名累计付费用户,且自解决方案推出以来产生100多万笔付款。从财务数据上看,2021年至2023年,出门问问的毛利率分别为37.5%、67.2%和64.3%。
同时,出门问问来自AI软件的收入,从2021年的0.60亿元增长到2023年的3.43亿元,年复合增长率140%,对应收入占比从2021年的15%上升到2023年的67.7%。其中,公司从AIGC解决方案获得的收入,2021年至2023年分别为682.2万元、3985.7万元和1.18亿元,复合年增长率超300%。
作为中国最早入局大模型的AI公司之一,出门问问不断探索最前沿的AI技术,研发费用率常年保持在20%至30%的水平,排名同行业头部。其中,公司2021年至2023年的研发费用,分别为0.92亿元、1.19亿元和1.55亿元,主要是研发人员增加及大模型开发技术成本增加。
业界稀缺的「产模结合」
构筑独特商业增长飞轮
在AIGC赛道,以中小企业为主的玩家聚集在应用层,以互联网大厂为代表的玩家聚焦模型层,而以出门问问为代表的“产模结合”公司并不多见,试图为行业开创新的商业化模式。
“产模结合”即产品和模型一体化,“产”指AI产品,“模”指AI大模型。该模式帮助大模型公司更好地确定方向,还通过产品实践对大模型微调和优化,快速实现特定领域、特定场景下的模型定制,满足不同行业客户的独特需求。
总结来看,如果一家公司既有产品又有模型,可以实现产品与模型的良性循环、共促互进,具备更强的核心竞争力,更有机会形成数据增长飞轮,实现TPF(Technology-Product Fit)到PMF(Product-Market Fit)的跃迁。
目前,AI技术进化曲线异常陡峭,企业通过自有资源持续迭代才有意义。资源可以靠融资,也可以通过“技术、产品、商业化”的自我闭环来获取,出门问问率先实现了后者,成为全球第一家盈利的大模型公司,AIGC年复合增长率超300%。
不同于大多数仍在融资烧钱、大炼模型的公司,出门问问早在2020年即拥有自研中文大模型,并在技术领先的前提下始终坚持产品和用户驱动,且率先跑通商业化,是为数不多做到了“技术、产品、商业化”三位一体的公司。
比如,2020年,出门问问就开始了大模型UCLAI的研发,对标当时的GPT-3,并推出了AI配音平台“魔音工坊”,也是生成式AI在中国的首款商业应用,位列“AI产品榜”Top 5。
如今,出门问问构建的“产模结合”的商业模式,在技术、产品、组织力等方面领先于同行。
目前,AI行业面临激烈竞争,特别是某些领先的技术公司有意通过价格竞争赢得AIGC市场份额。在技术方面,出门问问凭借全栈式技术积累,拥有以较低的研发成本,做性价比极高的研发能力。
在产品方面,出门问问多年深耕AI应用市场,锤炼了极致化的产品力,无论是备受全球消费者爱戴的智能手表TicWatch,还是全栈式AIGC产品矩阵,都成为行业标杆类产品。
在组织力方面,出门问问跨越周期的多方面积累,从硬件到软件、国际化,拥有快速适应技术陡峭变化的组织能力和运营能力,是具有不同能力板块组合的“积木型公司”。
未来,出门问问将继续根据其发展战略,以符合成本效益的方式在研发能力上投入资源。此外,通过增强现有算力提高规模、通用性和计算精度,将继续训练具有多模态生成能力的大模型——“序列猴子”。
招股书显示,出门问问将密切关注市场趋势和内容创作者的需求,以便能够推出新的功能、特点和解决方案,以提前在行业中满足内容创作者不时变化的需求,并扩大产品种类,增强解决方案的竞争力。
全球化基因与前瞻布局
2023年下半年至今,“出海”成为大批中国AI创业者的发展趋势。出门问问在团队、股东、产品、渠道等多方面均具有国际化基因,出海一直是其核心战略之一。
在团队方面,出门问问创始人李志飞出身美国约翰霍普金斯大学语言与语音处理实验室(CLSP),是前Google总部科学家、自然语言处理及人工智能专家,也是世界主流机器翻译开源软件Joshua主要开发者。
李志飞在组建出门问问团队时,注重国际化人才招募。据悉,出门问问在创立之初,便吸引了大量谷歌、微软的工程师加入,后来被冠以“美国名校收集器”的称号。目前,出门问问的全球员工中有61.9%是研发人员,绝大部分拥有海外名校背景。
出门问问很早就拥有了一支经验丰富的全栈式AI国际化团队,是业内少有兼具研发、产品、品牌、电商、销售、toB解决方案能力于一身的全球化创业公司,且拥有以解决方案为导向的全球研发架构。
出门问问凭借国际化团队,在创立之初就以语音助手软件切入市场,2015年推出TicWatch智能手表,同年与国际巨头谷歌达成战略合作,由此开启真正的全球化之路,2016年TicWatch登陆英美澳加等国家和地区,打响了在当地的知名度。
2023年,出门问问的“魔音工坊”海外版“Dupdub”上线,掀起了海外网友“捏声音”的热潮。据悉,“DupDub”拥有130多种逼真的声音和超15项编辑功能,支持超过37种语言,为音视频创作者提供转录、字幕对齐和下载以及数字人工具和平台,成为YouTube、Instagram等平台创作者的重要工具。
在此基础上,出门问问研发了超写实语音合成技术,赋能DupDub实现三秒克隆人声,保持技术领先优势。如今,“DupDub”面向全球40多个国家和地区提供服务,入选“AI产品榜”出海明星榜单。
出门问问的股东也呈现国际化,此前获得红杉资本、真格基金、SIG海纳亚洲、谷歌等国际知名机构的投资。其中,谷歌“陪伴”出门问问已有近十年。
此外,英伟达是出门问问在AIGC领域的深度合作公司,双方在3D数字人方面的合作成果,在不久前的GTC2024盛会上发布。
(CIS)