Hyper赛道：科大讯飞类ChatGPT应用的深度解析

发表时间: 2023-05-08 16:23

自现象级AI应用ChatGPT落地至今，作为应用技术商业化大国的中国，在短短半年内，对于这项能照耀未来的技术的商业化探索，堪称气象万千。

对于中国技术公司而言，若无一个类似ChatGPT应用的对标产品，可能难以显示其技术色彩。因此，但凡能数得上号的中国技术公司，截至目前，基本上都发布了各自的类ChatGPT应用。

5月6日，中国式ChatGPT再添新成员：科大讯飞发布星火认知大模型和多行业场景商业应用的AI能力。5月8日，科大讯飞股价涨停，为3月23日以来首次。

推动中国经济繁荣的改革开放，秉持的实用主义原则，其影响也波及了中国科技公司对于新技术的主流态度：新技术能否创造出确定的应用商业价值。有此指导思想，故其对底层技术的热情很少像对新技术的商业应用那样高涨。

但这不等于，中国技术公司缺乏底层技术探索和积累。他们只是需要有人给出这些底层技术极具商业价值想象空间的路径，然后，其应用这种底层创新技术的商业探索落地速度之快，举世无双。

科大讯飞作为一家以NLP语音技术立足的技术公司，自然也不例外——任何技术公司或文化现象，无不受宏观行业环境和历史传统影响。

那么，讯飞星火认知大模型的技术探索是什么？AI商业价值怎样落地？讯飞GPT技术能力如何与之业务匹配？强弱如何？未来这种能力怎样演进？

开放平台：如虎添翼？

5月6日，科大讯飞董事长刘庆峰发布星火认知大模型，并同步发布讯飞AI学习机、讯飞听见、讯飞智能办公本、讯飞智慧驾舱、讯飞开放平台等5项应用成果。其中，讯飞开放平台是构成科大讯飞商业（技术和产业）护城河的关键要件。

科大讯飞2022年财报显示，讯飞开放平台的毛利率为28.23%，同比提升7.02个百分点。在科大讯飞四大业务板块中毛利提升速度最快、升幅最大。

以AI技术为基石，通过“平台+赛道”市场战略，凭借“算法和数据”核心技术优势，科大讯飞在C端、B端和G端的AI领域攻城略地。

据科大讯飞联合创始人、高级副总裁江涛解释，“平台+赛道”，这个“平台”，即讯飞开放平台：“星火认知大模型对讯飞开放平台极具意义。”

2021年10月25日，刘庆峰在合肥发布“科大讯飞开放平台2.0战略”。

与1.0相比，讯飞平台2.0战略新增“行业龙头”，构成新的“讯飞+行业龙头+开发者”三维结构，目的是通过讯飞开放技术平台和工具，结合行业特性和数据，形成数字底座，再通过开发者将数字底座与特定的软硬件环境做匹配，最终形成完整的行业AI数字解决方案。

在这个过程中，开发者数量决定整个开放平台的垂类应用丰富性，开放平台的底层技术能力，决定开发者能用具备怎样强悍能力的技术工具，去开发垂类应用；而行业龙头带动的行业合作伙伴，用RPA（机器人流程自动化：Robotic Process Automation）等工具开发行业应用的易用性和有效性，也与开放平台的工具能力密切相关。

若对“讯飞+行业龙头+开发者”三维结构做个解构，即由科大讯飞提供AI技术、大数据平台和相关深度学习训练算法工具，行业龙头在此基础上提供场景、专家知识和各类业务模型。之后，由双方通过贯穿AI算法的业务模型形成数字基线底座。

有了基线底座，讯飞开放平台行业开发伙伴，可以做具体场景匹配软硬件环境的技术应用工具，完善和做各种流程开发，最终形成具体的可应用的行业解决方案。

因此，一旦讯飞星火认知大模型集成到开放平台，则平台工具能力之提升幅度，将难以想象。江涛说，“大模型进一步集成到开放平台后会带来整个开放平台能力的跃升，我们会进一步地赋能这些开放平台的合作伙伴。”

刘庆峰在5月6日披露，讯飞开放平台实名认证的开发者数量，已经突破400万，行业合作伙伴突破500万大关。2021年10月25日，实名注册开发者数量是265万。

讯飞星火认知大模型的底层能力，怎样赋能讯飞开放平台的行业伙伴？刘庆峰说，讯飞将开放插件。“合作伙伴、开发者可分享这些插件，以深入至大模型。这样用星火大模型就可以直接用到这些插件能力。”

随着应用的深入，可集成越来越多的专业插件：对行业插件安全性有要求的B端用户，可用星火认知大模型做富有针对功能的插件，以供其内部使用或做平台共享。这是科大讯飞To B策略的体现：建立行业生态圈，共同繁荣整体行业。

刘庆峰透露，“已有36个行业、超3000家企业跟我们达成了合作的明确意向。”

解构“1+N”的AI应用

美国OpenAI公司推出的ChatGPT应用，AI技术名称是GPT，而“Chat”则是应用手段或形式。通过Transformer架构做AI技术开发，应用终端的AI能力源自底层AI技术对语义大模型（LLM）的训练。

概括而言，OpenAI的ChatGPT-3.5（2022年12月推出的初代版），就是用Problem Models（问题模型）加上1750亿个参数/节点，以之为基础提供巨量、有监督的学习数据，借助Transformer架构，“投喂”给AI语义训练大模型（LLM），做出的AI应用效果。

科大讯飞星火认知大模型，作用相当于OpenAI训练语义大模型（LLM）做出的AI应用效果集成和问题模型的集合。这在2022年12月15日启动的科大讯飞认知大模型专项攻关中，属于“1”，而这个“1”落地的行业垂直领域或场景，被概括为“N”。

因此，科大讯飞的类ChatGPT应用，结构就是“1+N”。“1”是指星火认知大模型（可认为是通用AI技术底座），“N”即落地多场景。若将之从商业角度做个命名，则可称为“1+N”认知智能大模型技术及应用战略。

其中，通用认知AI技术底座包括七项能力：多层次跨语种语义理解、多风格多任务长文本生成、多模态输入和表达能力、多功能多语言代码能力、多题型可解析数学能力、情境式思维链逻辑推理和泛领域开放式知识问答。

从商业价值角度，通过通过AI技术底座，科大讯飞为各个行业设计行业技术工具，并且以之构建AI应用样板间，最终1和N形成飞轮效应，实现商业价值的正向循环。

科大讯飞主要业务分产品有四个类型：即教育产品和服务、开放平台、信息工程和运营商相关业务。

星火认知大模型除了集成至讯飞开放平台，另外重要的一极是使能讯飞软件和硬件产品，以提升或重构讯飞的业务竞争力。

这些软硬件产品所属场景即处于“1+N”中的“N”。5月6日，科大讯飞推出星火认知大模型的四大行业应用成果：教育、办公、汽车和数字员工。

其中，教育和办公方面，属于人机交互。讯飞主要落地形式是软硬件，如学习机、办公本或语音遥控器，以及讯飞听见（专业级语音转文字效率工具）。江涛说，“我们相信大模型的智慧涌现一定会带来下一代人机交互的新的入口。”

科大讯飞2022年财报显示，教育产品毛利率是49.39%，在科大讯飞营收中的占比32.74%，均为最高。

与To C相比，市场更关注讯飞医疗中的AI辅助诊疗，这块属于To B场景。据江涛透露，科大讯飞的智医助理迄今为止已做了5.8亿人次的AI辅诊，中国300多个区县的基层医疗机构的医生正在使用。

一旦讯飞医疗大模型推出，将更好地帮助医生提高病历质检、辅助诊断、方案推荐和用药管理等方面的水平。这属于B端中的C端应用，比如也能做个人保健咨询、健康管理和疾病管理。

但在5月6日，讯飞医疗大模型没有推出。对此，刘庆峰表示，“因为需要相关法规，所以我们应对医疗专业领域模型更加谨慎。下一步我们会跟医疗机构合作，通用大模型也会集成医疗专业知识。”

刘庆峰透露，科大讯飞将会在今年讯飞1024开发者大会上正式对外发布医疗大模型。

历史积累和未来目标

虽然科大讯飞的“1+N”认知大模型专项攻关于2022年12月25日启动，但讯飞在AI技术领域的技术积累已有十多年历史。

从AI技术发展路径看，ChatGPT也不是最新的技术成果。在理论上，ChatGPT没有更多创建——核心技术在2017年就已出现：由谷歌创建的Transformer神经网络架构，其革命性在于能让AI“听懂人话”。

科大讯飞星火认知大模型的底层AI技术起始源点，始于2011年成立的语音及语言信息处理国家工程实验室。这比ChatGPT应用的底层AI核心技术“Transformer神经网络架构”早了整整6年。

语音及语言信息处理在大模型中的作用是什么？刘庆峰说，“讯飞星火认知大模型本质上是一次对话式通用智慧的涌现，语音和语言的核心能力是基础条件，科大讯飞是中国（该领域）的国家队。”

讯飞取得和谷歌一样的认识，也就是让AI“听懂”人话的时间节点是2014年，也比谷歌早3年。

那年，科大讯飞推出讯飞超脑计划，明确提出要让机器像人一样，具备能理解会思考的能力。2022年1月，刘庆峰在科大讯飞年度总结计划大会上，宣布讯飞超脑2030计划：要让懂知识、会学习、能进化的通用人工智能技术，以机器人的实体形态或虚拟形态，进入每个家庭。

坦率地说，在OpenAI推出ChatGPT应用前，科大讯飞在AI领域的技术探索和落地成果相对“碎片”——这也是中国技术公司的“共性”——缺乏像ChatGPT这样的AI能力验证应用体系。ChatGPT不仅仅是个AI应用，也是一个商业化体系应用的象征性标杆。

因此，OpenAI实际上起的是验证AI技术商业价值的作用，以及引领AI应用方向。一旦方向确立，大模型的海量场景应用验证得以点亮，素有积累但找不到大规模有效价值应用明确方向的中国技术公司，其类ChatGPT技术开发和场景应用激情，就如脱缰野马，不可遏制。

在2017年这个关键节点，科大讯飞的AI技术积累到什么程度？他们让机器在全球首次通过国家执业医师资格考试综合笔试测试，测试成绩超过96.3%参加考试的医生。

两年后2019年，在斯坦福大学发起的国际著名的SQUAD机器阅读理解比赛中，科大讯飞让机器在英文阅读理解中首次超过人类平均水平；2022年，在艾伦研究院组织的Open Book QA知识推理比赛中，讯飞机器单模型首次超过人类平均水平。

或许意识到体系对于AI“听懂人话”技术目标达成的重要性，科大讯飞在5月6日也推出了AI应用体系，主要用于评测AI技术能力。目前，这项体系已覆盖7大类、481个细分任务类型的通用认知大模型评测。

比如，AI技术到底发展到什么程度？下一个发展应该往哪里走？技术距离实用是不是已经达标？还有哪些工作要做？

据刘庆峰介绍，目前讯飞星火大模型在文本生成、知识问答、数学能力三项能力已超越ChatGPT，“英文如果满分以5分计算，Chat GPT现在是4.48分，我们已达到4.29分。”据刘庆峰透露，“当前讯飞星火认知大模型的文本生成、知识问答和数学能力，已超过ChatGPT。”

根据既定计划，到今年10月底，讯飞星火认知大模型目标中文能力超过Chat GPT的水平，英文能力相当。

本文来自华尔街见闻，欢迎下载APP查看更多

Hyper赛道：科大讯飞类ChatGPT应用的深度解析

开放平台：如虎添翼？

解构“1+N”的AI应用

历史积累和未来目标

热门阅读

推荐阅读