【Helen's财经晚餐第50期】大模型应用落地,AIGC板块投资逻辑深度解析

发表时间: 2024-01-04 17:05

ChatGPT即将出世满周年。在这一年内,面对全新的市场,诸多公司涌入大模型赛道,形成“百模大战”的盛况。“狂飙”的大模型,并不囿于通用领域,也正以飞快的速度向各个场景渗透。据不完全统计,已有十余家A股上市公司计划涉足金融大模型。二级市场,多模态AI、MR是最近较为强势的概念,AIGC板块有何投资逻辑?今天《Helen’s财经晚餐》邀请到灼识咨询CIC总监陈一心来做深度分享。

附上本期直播时间轴,帮你快速跳转感兴趣的部分

01:39 大模型演变经历的一些阶段

06:00 目前大模型已经开始渗透到金融、医疗、汽车制造、零售等行业,具体应用能否举例?

09:10 大模型在哪些领域可能超过人类?大模型迭代的重点又在哪里?

17:42 作为一种先进的生产力变革,AIGC的兴起让世界进入了智能创作时代。它对企业和个人分别有哪些价值?

20:46 AIGC产业链涉及哪些?

24:26 大模型企业的算力投入

30:30 AIGC板块投资逻辑

34:02 GPGPU产业链的上游、中游、下游,以及涉及的代表性公司

Helen:最近你们发布了《大模型与AIGC蓝皮书》,对行业做了深度分析,我们今天的分享从产业现状延伸到投资逻辑。首先请介绍大模型演变经历了哪些阶段?

陈一心:大模型是基于海量多源数据打造的模型,是实现通用人工智能(AGI)的重要路径。大模型可以整合多种不同类型的数据和信息,实现多模态处理和分析,从而更全面地理解和解决复杂问题,其具备通用性、涌现性等诸多特点。

大模型从其形态来看,有几类,第一类我们姑且叫做“基础大模型”。基础大模型通常是面向通用领域进行开发的,知识储备量较大,能实现语言理解和生成,质量也还不错。但因为基础大模型通常更标准化,适用场景更普适、宽泛一些,所以更多是C端用户使用在一些压力不算大、或者比较简单的场景。想要B端应用的话还是有些吃力的,因为不够精,也暂时无法贴合B端企业更加专业和个性化要求,直接生成结果的质量对商用场景而言可能是不够的。

第二类我们叫精调大模型。精调大模型一般是基于基础大模型,进行更有针对性和细致的优化。不论是在某一领域专用性上的,还是在模型易用性上的,都是为了能让用户根据自己的实际场景需求,很容易地来使用大模型,并且达到高度可用的水平。我们认为精调大模型更重要的价值在于可以更好地满足B端客户的需求,达到能够商用的水准、并且为企业的实际运营和决策赋能。这个也可以理解为是“行业大模型”

刚刚也提到大模型在不断演进和完善,这里也想分享一个概念,叫能力涌现。用简单的话来解释“涌现”的意思,就是由量变达到质变的那个阶段。对于AI模型来说,能力涌现就是模型的规模达到某个临界点后,模型的表现会有一个质的提升。能力涌现的大模型其实并不算是大模型的一种形态,而是揭示了一个规律,就跟当年的摩尔定律有些类似,就是模型的参数越多,它越有可能在各类任务上有更好的表现。可以说明过去几年模型的参数规模越来越大所带来的一个好处。

不过,我们也看到目前可能也有个趋势,就是开始把大模型做小。不要误会,即使把大模型的参数规模做小,它也还是个很大的模型,参数量至少在百亿级别。我们看到有些研究去验证,小模型是否也能实现能力涌现。根据目前的研究发现,小模型在某一些任务上似乎也是具备涌现能力的,但不确定是否能泛化到其他任务中。这给大模型行业的一个启示就是,未来是有可能通过各种优化手段把大模型的规模尽量减小,但依然保持其输出质量。

Helen:目前大模型已经开始渗透到金融、医疗、汽车制造、零售等行业,具体应用能否举例?

陈一心:大模型已经广泛应用于金融、医疗、汽车制造等领域,如风险控制评估、交易环节等。大模型的优势在于性能和交互性的提高,使其更适合处理复杂任务和与人类的沟通方式。此外,大模型还在各领域不断演进,例如在零售领域的个性化推荐、定价优化等方面也有所应用。

在金融领域,大模型主要应用包括风险评估、量化交易、柜台业务办理等。以风险评估为例,大模型可用于预测信用风险、 欺诈检测和市场趋势分析。在医疗领域,大模型可应用于疾病诊断、 药物发现等场景。以疾病诊断为例,大模型可用于医学图像识别,如X射线、MRI和 CT扫描,以帮助医生诊断疾病。在汽车领域,大模型可应用于自动驾驶、 虚拟设计和仿真、质量控制、供应链管理、销售和营销、定制设计、新能源汽车性能优化等。在制造业领域,大模型主要应用场景包括工业自动化、供应链优化等。以工业自动化为例,大模型可用于监控生产过程,预测设备故障,提高生产效率。在零售行业,大模型可应用于个性化推荐、 价格优化等场景。

Helen:大模型未来可能在哪些领域超过人类?

陈一心:至少有一点特征是比较明显的,不论大模型输出内容的质量如何,它的输出速度/效率大概率是高于一般人的。输出文字可能是大家目前自己用得最多的,相信感受会比较深刻;除此之外,代码、图画、视频、3D建模等,这种本身工程量就很大、非常花时间的领域,这种体感可能就更明显。而且这些是我们作为普通C端用户就可以切实感受到的。

回到具体大模型在各领域的表现,我觉得分成3个层次,分别是已经做到且能与人类媲美,已经做到但还不及人类,还做不到。首先,现在大模型已经可以和人类媲美的方面有:视觉/听觉识别,学习能力,自然语言理解等,这其实是在大模型出现之前,其他AI模型就已经在尝试攻克的领域,而大模型直接加速了这个进程并且让所有人都能体会到。其次,大模型已经具备但需要改进的有:创造性思维、抽象思维、艺术表现等,这些领域一定程度上依赖于人类的审美、创造或逻辑能力,大模型需要继续精进才能赶上。最后,大模型还不具备的是对伦理是非的判断、直觉等,这些其实接近了 “人性”的范畴,大模型目前只能尝试去总结、模仿,但无法达到人类的水平。

Helen:大模型产品未来有怎样的发展趋势?

陈一心:多模态模型是一种能更好地理解、生成语言的技术,其核心优势在于对大规模语言数据集的学习能力和理解能力。通过多模态技术,我们可以更好地捕捉用户的情感、意图等信息,从而提高交流体验。此外,多模态模型还能帮助我们生成更高质量的文章和对话,这对于企业和个人的工作和生活都非常有益。随着人工智能技术的发展,未来多模态模型将极大地推动各行各业的发展,为人类带来更多的便利和创新。

其次是对于大模型性能的进一步提升,让内容输出质量更好、速度更快、处理更加复杂的任务,对于比较杂乱的内容也能够进行梳理,有更好的逻辑推理能力。此外,比较重要的趋势是建立更包容的开放生态,比如最近GPT4-Turbo的发布,也同步发布了类似App Store的平台,用户可以上传专属的GPT模型,由此建立起开发者、创作者生态,源源不断地为开发者社区注入活力。

Helen:AIGC有望掀起新一轮产业革命,它对企业和个人分别有哪些价值?如何提升其工作效率?

陈一心:AIGC的终极目标是结合PGC和UGC的优点。PGC的优点是内容可控,质量上乘;UGC的优点则是内容生产效率高、性价比高。AIGC要做到的就是在高效产出的同时,保证内容质量。这样对企业来说,就是降低了高质量内容的创作边际成本。对个人用户来说,有了AIGC的帮助,大幅降低了内容创作的门槛。未来继续发展的话,我们刚说到多模态是大模型发展的一大趋势,未来的AIGC一定也会受益于大模型大发展,因此可以预见的是,AIGC在未来也会具备更成熟的多模态内容创造能力,增加内容创作的多样性。

Helen:AIGC产业链涉及哪些?

陈一心:AIGC产业仍处于早期发展阶段,在数据、算法和算力的基础之上,核心模型以关键企业研究成果为主导,AIGC以AI生成文本、图像、视频和音频为主流形式。上游是基础层,包括数据、算法及模型、算力。数据包括业务数据连通、素材数据搜集等;算法及模型包含神经网络、深度学习、自然语言处理技术、扩散模型、 云渲染等开源算法,以及基于算法通过数据训练生成的机器学习模型、深度学习模型及大模型等。算力包括服务器、GPU、 HPC、云等提供基本计算能力的基础设施。中层也就是应用层,包括文本生成、图像与视频生成、音频生成。应用层的产品使用上游的算法模型框架,进行针对性的优化,价值是在于充分发挥某一类大模型算法或者框架的特长,给用户带来更加良好的使用体验。下游就是终端用户层,包含各类内容创作及分发平台、内容终端生产厂商、第三方内容服务机构,等等。

Helen:算力提升是AIGC发展的重要驱动力之一,愈大的算力规模可以支撑更大规模的模型运转。算力芯片、AI服务器有望持续放量,数据中心建设提速。各国纷纷提速数据中心建设,我国“东数西算” 工程投资规划逐步清晰。在A股市场上,已有很多家企业抛出了定增募资计划拟进军该行业。您对这些企业有何建议?

陈一心:我们现在能看到大模型在B端商用中实际落地的方式,主要是把大模型浓缩成一个相对轻量的行业小模型,专攻一个相对垂直的领域。一方面可以显著缩小模型的参数量,这样在训练和推理过程中所需要消耗的算力也会随之变小;另一方面,分别以合理的成本攻克一个个专业领域,似乎是目前更平衡的一种方式。所谓的金融大模型,其实我们也可以认为是一个相对轻量的行业小模型,专攻金融领域的一个应用,比如风控、营销等。这对企业的实际应用才更具有价值。

另一个最近比较火的大模型应用,是手机大模型。从研发侧来看,手机厂商在人工智能大模型的投入确实需要大量的资源和资金。与国内领先的大模型厂商相比,手机厂商在算力基础设施上的储备往往不够充足,这使得他们在研发过程中经常遇到算力受限的情况。对于手机厂商来说,这一投入不仅需要大量的资金,还会面临技术上的挑战。

从应用侧来看,轻量化本地部署是手机大模型的一个重要趋势。由于用户隐私、响应及时程度和云端使用成本等因素的考虑,手机大模型需要以端侧部署为主。这意味着大模型将直接部署到手机内,并由手机芯片承担模型推理的工作。为了实现轻量化本地部署,手机厂商需要开发出适合在手机中运行的大模型,这需要使用更少的数据量和计算资源。同时,还需要优化模型的推理速度和精度,以确保模型能够在手机上高效运行。

Helen:AIGC板块投资逻辑是怎样的?

陈一心:投资者应关注公司是否具备过硬的技术基础,如大规模计算、深度学习和神经网络等先进技术,评判大模型技术,要综合各种信息去看。可能因为使用了不同的流程和标准,各家评测机构的结果差异巨大;其次是要看公司在特定细分市场的落地场景,例如金融领域的大数据分析能力,或零售业的数字化转型等。是否真正落地以及怎样落地,对于B端企业价值更高。

大模型产业在过去一年得到了广泛关注,但投资者仍需关注其技术能力和落地场景。此外,还提到了GPG PU(通用图形处理器)的高并发计算资源在大模型训练和推理方面的作用。GPG PU产业链涉及多个环节,如半导体IP服务提供商、晶圆设计商等,为企业提供核心技术支持。同时,各行业的企业也在努力开发相关技术和产品以满足市场需求。

以上是本期Helen's财经晚餐的部分内容,想看完整内容,可观看Helen's财经晚餐第50期《大模型应用落地,AIGC板块投资逻辑分析》直播回放。

Helen's财经晚餐每双周二17点开播,直播将在钛媒体APP、钛媒体PC、钛媒体微博、钛媒体视频号、钛媒体百家号同步直播。(主理人:Helen;策划:Helen ;导播:羽赫;文章:Helen)