科大讯飞挑战国产ChatGPT,百日应用落地计划启动!

发表时间: 2023-02-17 17:17

近日,由人工智能实验室 OpenAI 发布的对话式大型语言模型 ChatGPT一路“狂飙”,在全球学术界和产业界卷起了新一轮 AI 龙卷风,成为了史上增速最快的消费级应用程序。

短短两个月,这个 AI 界乃至科技圈的“新晋顶流”月活便超过 1 个亿。社交媒体推特首席执行官埃隆·马斯克在使用 ChatGPT 后直呼其“好得吓人”,甚至断言“人工智能越发强大,离对人类产生威胁不远了”。作为参考,为了达到 1 个亿活跃用户的“小目标”,Twitter 用了 5 年,Facebook 用了 4.5 年,Google 用了将近 1 年,就连苹果用户装机必备的 App Store 都用了 2 年。

CSDN 创始人&董事长、极客帮创投合伙人蒋涛在《开谈》栏目中谈到,ChatGPT 的出现标志着 AI 进入了当年的 “iPhone” 时刻。据 2 月 13 日,北京市发布的《2022 年北京人工智能产业发展白皮书》中提出,支持头部企业打造对标 ChatGPT 的大模型,着力构建开源框架和通用大模型的应用生态。

与此同时,百度、阿里巴巴、科大讯飞、360、京东等国内科技巨头也纷纷官宣ChatGPT相关布局,旨在打造“中国版ChatGPT”。可以预见,这场以自然语言处理为核心的认知智能技术所带来的革命,将会深刻地改变当今世界的生产和生活方式,甚至重构产业格局,是人工智能领域推动工业乃至社会变革的重大战略机遇。

值得关注的是,在国内科技大厂中,长期深耕在AI技术领域的科大讯飞在智能语音、机器学习领域有深厚的技术储备,其技术实力和应用都有不俗的成绩,因此不少业内人士十分关注科大讯飞在 ChatGPT 赛道中的布局。

对此,科大讯飞在投资者互动平台表示,ChatGPT 主要涉及到自然语言处理相关技术,属于认知智能领域的应用之一。科大讯飞在该方向技术和应用具备长期深厚的积累,在 2022 年 12 月已经进一步启动生成式预训练大模型任务攻关,类 ChatGPT 技术将在今年 5 月率先落地到科大讯飞 AI 学习机产品中。


ChatGPT成未来AI发展的兵家必争之地


ChatGPT 的本质上是一个由浮点数参数表示的深度神经网络大模型(目前版本含约 1750 亿个参数),属于深度学习的框架。

科大讯飞副总裁、研究院执行院长刘聪

科大讯飞副总裁、研究院执行院长刘聪表示,ChatGPT 将为以自然语言处理为核心的认知智能技术发展提供新的“历史机遇期”。

因为它不仅是停留在单一场景的人机对话,而是同时具备多种能力的通用“对话式 AI 系统”。ChatGPT 的意图理解能力,在当前机器理解人类语言及生成人的自然语言水平中一骑绝尘。而 ChatGPT 的“类人化”,得益于其认知智能水平的进一步提升。

人工智能技术中有三个层次,分别是计算智能、感知智能和认知智能。其中最具有挑战的就是认知智能。具体来说,认知智能指的是:认知智能旨在赋予机器理解和模拟人类行为的能力,使机器“能理解、会思考、有情感”。而让机器掌握人类独有的语言和知识能力的人工智能技术,包含了机器翻译、人机对话、知识推理、机器阅读理解、常识推理等具体任务,属于人工智能发展的高级阶段。

ChatGPT 的出现,代表着人工智能在认知智能领域前进了一大步。尽管中国在认知智能领域技术相关论文发表数量仅次于美国,但在质量上与美国还有一定的差距。令人欣慰的是,我国认知智能已在教育、医疗、金融、政务等多个领域落地。与国外相比,国内在产业应用模式探索上走在了世界前列,具备良好的技术基础、场景基础和数据基础。

以科大讯飞为例,基于强大的 AI 技术能力,早期便主导承建了认知智能全国重点实验室,并取得了一系列领先的技术研究成果,在产业实现了大规模应用;2022 年在智慧教育领域累计获得常识阅读理解挑战赛 OpenBookQA、QASC、ReClor 等 13 项认知智能国际竞赛冠军;针对智慧医疗领域发布的系统可诊断 1200 多种常见病,累计提供 5.5 亿次 AI 辅诊建议;另外在人机交互领域、多语种技术研究方面均有着不俗的成绩。

另一方面,科大讯飞面向认知智能领域陆续开源了 6 大类、超过 40 个通用领域的系列中文预训练语言模型,在 GitHub 获 13346 颗星,位列中文预训练模型星标数第一。从各种数据中可以看出,科大讯飞在认知智能应用、预训练模型的应用方面已经相当成熟,加上在AI特定领域和NLP领域多年的累积,科大讯飞可谓是拥有着 AI 领域纵深的先发优势。

从技术储备与技术实力上来看,CSDN 认为科大讯飞想要做出 ChatGPT 类的产品并非没有可能。但做出中国版 ChatGPT,所需要的还远不止这些。


算法+数据+算力,ChatGPT 三大基本盘


据刘聪分析,ChatGPT 之所以引发全球学术界和产业界的热议和关注的关键原因,在于其通过至少以下五个维度能力的显著提升:

  1. 海量高价值信息的全量在线记忆能力;

  2. 自然语言输入的任意任务和多轮对话理解能力;

  3. 复杂逻辑的思维链推理能力;

  4. 多角色多风格的长文本生成表达能力;

  5. 即时新知识学习应用与进化能力。此外,因为引入了代码作为训练语料,ChatGPT 还额外产生了自动写代码和理解代码的能力。

总地来说,想要从 0 到 1 去打造一个中国版 ChatGPT,核心要素在于数据、算法和算力。

1、海量专业数据与场景,为大模型创新夯实基础

基于人工智能技术,在 ChatGPT 给出的回答中,其准确性取决于使用的算法和训练数据。通俗来说,可以将 ChatGPT 理解为通过大规模预先训练,处理巨量语言材料,从而获得接近人与人直接对话能力的一种算法模型。根据用户的测试,在相对深度和专业的领域,受限于训练数据的专业度,ChatGPT 在一些回答上容易给出“看似有理有据”的错误回答,这种情况在细节内容上尤为突出。

对于预训练模型来说,数据的质量和数量直接影响模型的质量,因此,如何进一步引入显性知识、常识类知识来提升目前输出答案的可靠性和稳定性,尤其是在一些细节的内容上。

而AI起家的科大讯飞,在严格遵守适用法律法规前提下,凭借在讯飞输入法、讯飞开放平台、消费办公类产品中积累的大量数据,以及多年来在医疗、教育等专业领域累积了规模化的高壁垒、高门槛的专业数据,在数据数量和质量方面筑起了自身的护城河,实力相当“能打”。

根据统计,目前科大讯飞在多年认知智能系统研发推广中,已经积累了超过 50TB 的行业语料和每天超 10 亿人次用户交互的活跃应用。海量行业文本语料和用户反馈数据,足以实现达到人类专家水平的行业认知大模型的训练需求。

2、算法与算力,是入局门槛之一

ChatGPT 效果体验上获得较大提升的原因之一是算法环节的突破,因此,打造一个类 ChatGPT 大模型,除了数据以外,还需要在算法和算力两个方面努力。

据刘聪介绍,ChatGPT 以当前业界主流的 Transformer 模型为主结构,单次模型训练耗时 1 个月,训练成本达 1200 万美元,超大模型的训练需要大规模计算集群以及对应的模型并行算法框架的支撑,因此他判断 1000 张主流卡容量的独立计算集群是完成该类任务的门槛之一。

科大讯飞在 Transformer 深度神经网络算法方面有着相当丰富的经验,已广泛应用于科大讯飞的语音识别、图文识别、机器翻译等任务中,并达到了国际领先水平。另一方面,还创新提出了知识与大模型融合统一的理解框架 X-Reasoner,有望弥补大模型的模糊记忆技术短板。

超大模型由于参数规模大、数据体量大,因此需要更大的算力支持。科大讯飞的优势在于,自身总部自建有业界一流的数据中心,为大模型训练平台建设奠定了很好的硬件基石。此外,在工程技术方面实现了百亿参数大模型推理效率的近千倍加速,为未来更大更多认知智能大模型技术经济实惠规模化应用提供了可能。

刘聪认为,打造中国版 ChatGPT 更重要的一点在于,应该需要选择一个社会刚需应用或有大量活跃用户的应用作为切入点,这些应用可以结合用户交互体验数据,反馈给模型后进一步提升模型的能力,在数据和模型之间形成正向反馈循环的“涟漪效应”,使得迭代更新后的模型越来越强。因此,不局限于技术本身,打破实验室与使用场景的壁垒,是达成有效“涟漪效应”的重点。

3、打破技术壁垒,以场景需求倒逼技术打磨

针对上述问题,科大讯飞早在 20 多年前便躬身入局。自 2005 年科大讯飞 AI 研究院成立起便开始探索 NLP 技术,而由于其天然具有人与计算机沟通桥梁的属性,让科大讯飞在探索感知智能的同时也实现了认知智能的同步探索,并且在实现 NLP 技术落地的过程中,发现仅立足于技术去思考匹配使用场景的方式,是很难行得通的。

因此,科大讯飞通过反复探索和复盘,摒弃了“拿着萝卜去找坑”的方式,探索出一个“基于实际业务场景和需求,反向倒逼技术打磨”的思路,最终成就了科大讯飞 AI 技术能够迅速从研发到规模化落地的能力。

从技术应用角度来说,ChatGPT 并没有显著的创新性,出圈的原因主要在于选对了技术应用的落脚点。中国版 ChatGPT 在打造过程中,除了技术打磨以外,需要更丰富、更细化的场景反哺,同时在专业领域上,保持基于场景的数据迭代和核心技术的更新,才能“解锁”更多技术的应用创新方式。

结合多年来在深度学习算法、大模型技术、行业大数据、知识图谱、多模态感知、系统工程技术方面优势积累,形成了从核心技术到合作资源到数据迭代的综合优势,也为基于大模型的创新应用研发和试点推广提供了场景保障。另外,基于其自主可控的核心技术底座,科大讯飞投身打造中国版 ChatGPT,有望能够实现类似的技术阶跃进步,在中文认知智能领域达到国际领先水平。


“1+N”核心技术底座,脚踏实地做科研


基于“讯飞超脑 2030 计划”,科大讯飞面向复杂场景的多模感知、多维表达、深 度理解、AI 运动智能算法等持续保持业界领先,国产化平台已常态化应用于 AI 算 法研发,实现核心技术底座自主可控。这意味着,无论未来技术发展出多少新的业务、新的应用场景,都可以基于该技术底座灵活应对。

比如,为了进一步提高大模型在细分行业的实用性,科大讯飞计划采用“1+N”架构,基于“1”个通用认知智能大模型算法研发及高效训练底座平台,应用于“N”个领域的专用大模型版本,包括教育、医疗、人机交互、办公、汽车、翻译、工业等多个行业。例如,通过学习海量医学教材、论文和病例,实现专业的医疗领域对话式 AI 系统,打造“每个医生的 AI 诊疗助理,每个人的 AI 健康助手”。

不过,尽管 ChatGPT 的出现让 AI 领域和资本市场都处于相当热血的状态,刘聪表示,兴奋归兴奋,关键在于踏踏实实把科研做好、把产品做好、把服务做好,最终回归到人工智能红利能否兑现的三大标准:

  • 有没有看得见摸得着的真实应用案例;

  • 有没有能够规模化推广应用的产品;

  • 有没有统计数据能够证明应用成效。

刘聪真诚地表示,对于科大讯飞来说,本着 “实事求是”态度,紧跟国际最新发展,保持敬畏之心。同时在跟跑到并跑的同时要在一些擅长的领域做到领跑,如语音识别、翻译、教育、医疗这些领域,依托行业知识和专业理解能力,形成规模用户和商业模式的良性迭代。

CSDN 认为,在当前的 “ChatGPT 热”下,我们在拥抱新的技术范式和技术潮流之余,还需要结合场景来思考,找到适合的发展路径和应用场景是关键。另外,正如刘聪院长所言,保持健康踏实的良性心态也非常重要。最后,发展中国版 ChatGPT 离不开各界齐心协力,一同构建美好开源框架和通用大模型的应用生态。