【Helen's财经晚餐第50期】大模型应用落地，AIGC板块投资逻辑深度解析

发表时间: 2024-01-04 17:05

ChatGPT即将出世满周年。在这一年内，面对全新的市场，诸多公司涌入大模型赛道，形成“百模大战”的盛况。“狂飙”的大模型，并不囿于通用领域，也正以飞快的速度向各个场景渗透。据不完全统计，已有十余家A股上市公司计划涉足金融大模型。二级市场，多模态AI、MR是最近较为强势的概念，AIGC板块有何投资逻辑？今天《Helen’s财经晚餐》邀请到灼识咨询CIC总监陈一心来做深度分享。

附上本期直播时间轴，帮你快速跳转感兴趣的部分

01:39 大模型演变经历的一些阶段

06:00 目前大模型已经开始渗透到金融、医疗、汽车制造、零售等行业，具体应用能否举例？

09:10 大模型在哪些领域可能超过人类？大模型迭代的重点又在哪里？

17:42 作为一种先进的生产力变革，AIGC的兴起让世界进入了智能创作时代。它对企业和个人分别有哪些价值？

20:46 AIGC产业链涉及哪些？

24:26 大模型企业的算力投入

30:30 AIGC板块投资逻辑

34:02 GPGPU产业链的上游、中游、下游，以及涉及的代表性公司

Helen：最近你们发布了《大模型与AIGC蓝皮书》，对行业做了深度分析，我们今天的分享从产业现状延伸到投资逻辑。首先请介绍大模型演变经历了哪些阶段？

陈一心：大模型是基于海量多源数据打造的模型，是实现通用人工智能(AGI)的重要路径。大模型可以整合多种不同类型的数据和信息，实现多模态处理和分析，从而更全面地理解和解决复杂问题，其具备通用性、涌现性等诸多特点。

大模型从其形态来看，有几类，第一类我们姑且叫做“基础大模型”。基础大模型通常是面向通用领域进行开发的，知识储备量较大，能实现语言理解和生成，质量也还不错。但因为基础大模型通常更标准化，适用场景更普适、宽泛一些，所以更多是C端用户使用在一些压力不算大、或者比较简单的场景。想要B端应用的话还是有些吃力的，因为不够精，也暂时无法贴合B端企业更加专业和个性化要求，直接生成结果的质量对商用场景而言可能是不够的。

第二类我们叫精调大模型。精调大模型一般是基于基础大模型，进行更有针对性和细致的优化。不论是在某一领域专用性上的，还是在模型易用性上的，都是为了能让用户根据自己的实际场景需求，很容易地来使用大模型，并且达到高度可用的水平。我们认为精调大模型更重要的价值在于可以更好地满足B端客户的需求，达到能够商用的水准、并且为企业的实际运营和决策赋能。这个也可以理解为是“行业大模型”

刚刚也提到大模型在不断演进和完善，这里也想分享一个概念，叫能力涌现。用简单的话来解释“涌现”的意思，就是由量变达到质变的那个阶段。对于AI模型来说，能力涌现就是模型的规模达到某个临界点后，模型的表现会有一个质的提升。能力涌现的大模型其实并不算是大模型的一种形态，而是揭示了一个规律，就跟当年的摩尔定律有些类似，就是模型的参数越多，它越有可能在各类任务上有更好的表现。可以说明过去几年模型的参数规模越来越大所带来的一个好处。

不过，我们也看到目前可能也有个趋势，就是开始把大模型做小。不要误会，即使把大模型的参数规模做小，它也还是个很大的模型，参数量至少在百亿级别。我们看到有些研究去验证，小模型是否也能实现能力涌现。根据目前的研究发现，小模型在某一些任务上似乎也是具备涌现能力的，但不确定是否能泛化到其他任务中。这给大模型行业的一个启示就是，未来是有可能通过各种优化手段把大模型的规模尽量减小，但依然保持其输出质量。

Helen：目前大模型已经开始渗透到金融、医疗、汽车制造、零售等行业，具体应用能否举例？

陈一心：大模型已经广泛应用于金融、医疗、汽车制造等领域，如风险控制评估、交易环节等。大模型的优势在于性能和交互性的提高，使其更适合处理复杂任务和与人类的沟通方式。此外，大模型还在各领域不断演进，例如在零售领域的个性化推荐、定价优化等方面也有所应用。

在金融领域，大模型主要应用包括风险评估、量化交易、柜台业务办理等。以风险评估为例，大模型可用于预测信用风险、欺诈检测和市场趋势分析。在医疗领域，大模型可应用于疾病诊断、药物发现等场景。以疾病诊断为例，大模型可用于医学图像识别，如X射线、MRI和 CT扫描，以帮助医生诊断疾病。在汽车领域，大模型可应用于自动驾驶、虚拟设计和仿真、质量控制、供应链管理、销售和营销、定制设计、新能源汽车性能优化等。在制造业领域，大模型主要应用场景包括工业自动化、供应链优化等。以工业自动化为例，大模型可用于监控生产过程，预测设备故障，提高生产效率。在零售行业，大模型可应用于个性化推荐、价格优化等场景。

Helen：大模型未来可能在哪些领域超过人类？

陈一心：至少有一点特征是比较明显的，不论大模型输出内容的质量如何，它的输出速度/效率大概率是高于一般人的。输出文字可能是大家目前自己用得最多的，相信感受会比较深刻；除此之外，代码、图画、视频、3D建模等，这种本身工程量就很大、非常花时间的领域，这种体感可能就更明显。而且这些是我们作为普通C端用户就可以切实感受到的。

回到具体大模型在各领域的表现，我觉得分成3个层次，分别是已经做到且能与人类媲美，已经做到但还不及人类，还做不到。首先，现在大模型已经可以和人类媲美的方面有：视觉/听觉识别，学习能力，自然语言理解等，这其实是在大模型出现之前，其他AI模型就已经在尝试攻克的领域，而大模型直接加速了这个进程并且让所有人都能体会到。其次，大模型已经具备但需要改进的有：创造性思维、抽象思维、艺术表现等，这些领域一定程度上依赖于人类的审美、创造或逻辑能力，大模型需要继续精进才能赶上。最后，大模型还不具备的是对伦理是非的判断、直觉等，这些其实接近了 “人性”的范畴，大模型目前只能尝试去总结、模仿，但无法达到人类的水平。

Helen：大模型产品未来有怎样的发展趋势？

陈一心：多模态模型是一种能更好地理解、生成语言的技术，其核心优势在于对大规模语言数据集的学习能力和理解能力。通过多模态技术，我们可以更好地捕捉用户的情感、意图等信息，从而提高交流体验。此外，多模态模型还能帮助我们生成更高质量的文章和对话，这对于企业和个人的工作和生活都非常有益。随着人工智能技术的发展，未来多模态模型将极大地推动各行各业的发展，为人类带来更多的便利和创新。

其次是对于大模型性能的进一步提升，让内容输出质量更好、速度更快、处理更加复杂的任务，对于比较杂乱的内容也能够进行梳理，有更好的逻辑推理能力。此外，比较重要的趋势是建立更包容的开放生态，比如最近GPT4-Turbo的发布，也同步发布了类似App Store的平台，用户可以上传专属的GPT模型，由此建立起开发者、创作者生态，源源不断地为开发者社区注入活力。

Helen：AIGC有望掀起新一轮产业革命，它对企业和个人分别有哪些价值？如何提升其工作效率？

陈一心：AIGC的终极目标是结合PGC和UGC的优点。PGC的优点是内容可控，质量上乘；UGC的优点则是内容生产效率高、性价比高。AIGC要做到的就是在高效产出的同时，保证内容质量。这样对企业来说，就是降低了高质量内容的创作边际成本。对个人用户来说，有了AIGC的帮助，大幅降低了内容创作的门槛。未来继续发展的话，我们刚说到多模态是大模型发展的一大趋势，未来的AIGC一定也会受益于大模型大发展，因此可以预见的是，AIGC在未来也会具备更成熟的多模态内容创造能力，增加内容创作的多样性。

Helen：AIGC产业链涉及哪些？

陈一心：AIGC产业仍处于早期发展阶段，在数据、算法和算力的基础之上，核心模型以关键企业研究成果为主导，AIGC以AI生成文本、图像、视频和音频为主流形式。上游是基础层，包括数据、算法及模型、算力。数据包括业务数据连通、素材数据搜集等；算法及模型包含神经网络、深度学习、自然语言处理技术、扩散模型、云渲染等开源算法，以及基于算法通过数据训练生成的机器学习模型、深度学习模型及大模型等。算力包括服务器、GPU、 HPC、云等提供基本计算能力的基础设施。中层也就是应用层，包括文本生成、图像与视频生成、音频生成。应用层的产品使用上游的算法模型框架，进行针对性的优化，价值是在于充分发挥某一类大模型算法或者框架的特长，给用户带来更加良好的使用体验。下游就是终端用户层，包含各类内容创作及分发平台、内容终端生产厂商、第三方内容服务机构，等等。

Helen：算力提升是AIGC发展的重要驱动力之一，愈大的算力规模可以支撑更大规模的模型运转。算力芯片、AI服务器有望持续放量，数据中心建设提速。各国纷纷提速数据中心建设，我国“东数西算” 工程投资规划逐步清晰。在A股市场上，已有很多家企业抛出了定增募资计划拟进军该行业。您对这些企业有何建议？

陈一心：我们现在能看到大模型在B端商用中实际落地的方式，主要是把大模型浓缩成一个相对轻量的行业小模型，专攻一个相对垂直的领域。一方面可以显著缩小模型的参数量，这样在训练和推理过程中所需要消耗的算力也会随之变小；另一方面，分别以合理的成本攻克一个个专业领域，似乎是目前更平衡的一种方式。所谓的金融大模型，其实我们也可以认为是一个相对轻量的行业小模型，专攻金融领域的一个应用，比如风控、营销等。这对企业的实际应用才更具有价值。

另一个最近比较火的大模型应用，是手机大模型。从研发侧来看，手机厂商在人工智能大模型的投入确实需要大量的资源和资金。与国内领先的大模型厂商相比，手机厂商在算力基础设施上的储备往往不够充足，这使得他们在研发过程中经常遇到算力受限的情况。对于手机厂商来说，这一投入不仅需要大量的资金，还会面临技术上的挑战。

从应用侧来看，轻量化本地部署是手机大模型的一个重要趋势。由于用户隐私、响应及时程度和云端使用成本等因素的考虑，手机大模型需要以端侧部署为主。这意味着大模型将直接部署到手机内，并由手机芯片承担模型推理的工作。为了实现轻量化本地部署，手机厂商需要开发出适合在手机中运行的大模型，这需要使用更少的数据量和计算资源。同时，还需要优化模型的推理速度和精度，以确保模型能够在手机上高效运行。

Helen：AIGC板块投资逻辑是怎样的？

陈一心：投资者应关注公司是否具备过硬的技术基础，如大规模计算、深度学习和神经网络等先进技术，评判大模型技术，要综合各种信息去看。可能因为使用了不同的流程和标准，各家评测机构的结果差异巨大；其次是要看公司在特定细分市场的落地场景，例如金融领域的大数据分析能力，或零售业的数字化转型等。是否真正落地以及怎样落地，对于B端企业价值更高。

大模型产业在过去一年得到了广泛关注，但投资者仍需关注其技术能力和落地场景。此外，还提到了GPG PU（通用图形处理器）的高并发计算资源在大模型训练和推理方面的作用。GPG PU产业链涉及多个环节，如半导体IP服务提供商、晶圆设计商等，为企业提供核心技术支持。同时，各行业的企业也在努力开发相关技术和产品以满足市场需求。

以上是本期Helen's财经晚餐的部分内容，想看完整内容，可观看Helen's财经晚餐第50期《大模型应用落地，AIGC板块投资逻辑分析》直播回放。

Helen's财经晚餐每双周二17点开播，直播将在钛媒体APP、钛媒体PC、钛媒体微博、钛媒体视频号、钛媒体百家号同步直播。（主理人：Helen；策划：Helen ；导播：羽赫；文章：Helen）

【Helen's财经晚餐第50期】大模型应用落地，AIGC板块投资逻辑深度解析

热门阅读

推荐阅读