AI引领下的工业软件开发：提质增效的创新之路

发表时间: 2024-05-17 17:39

2024年5月16日，华为混合云研发生产线总监赵子武在华为AI+制造行业峰会上发表《提质增效，AI赋能软件开发创新》主题演讲，详细介绍基于华为云Stack的CodeArts软件开发生产线，基于华为多年研发最佳实践和工具，覆盖软件开发全生命周期服务。

华为混合云研发生产线总监赵子武

2024年，基于华为云Stack混合云的CodeArts迎来全新升级，新增盘古研发大模型加持下的CodeArts Snap智能开发助手，提供代码生成、研发知识问答、单元测试、代码解释、代码注释、代码调试、代码翻译和代码检查等核心八大特性，帮助开发者端到端提升研发效率超过20%。

会上，赵子武详细介绍了CodeArts Snap智能开发助手的3大关键竞争力：

CodeArts Snap关键竞争力一：构建精品研发训练数据，塑造天生高质量模型

华为云Stack构建一整套开发工具链、基本法和自动化平台，基于1.5万亿开源研发数据以及华为各产品线代码，精心筛选出了500亿Token精品研发数据。

基本法包含三个内容：第一个模型的语料质量，只有进行清晰高质量的问题，大量正确的背景知识，以及能够明确的表达出自己的要求，最后输出来的结果才可能是对的。第二个就是清洗出来的数据是高质量的，清洗的过程是有序的，数据是有保障的。第三是评测基本法，训练出来的代码生成模型，要有清晰的评价标准，要有一套比较中立的，比较专业的一种方法去评测，而不是靠主观来评价。

有了基本法之后，CodeArts Snap也建立了两个自动化的工具平台，一个是自动化的数据清洗平台，一个是自动化的模型评测平台，支撑持续高效运营，保证模型训练持续优化。

CodeArts Snap关键竞争力二：强化训练+评价反馈，模型“越用越聪明”

好的评估机制可以对模型进行强化学习，基于这套强化学习的逻辑，让研发大模型的代码生成能力更强。采用内外循环的方式来迭代优化我们的训练数据，从而让这个模型越训练越聪明。

外循环是指用户使用的时候，系统会收到用户评价和反馈，比如是否接受完全结果，还是不接受或者部分接受。将这些数据集注入到到下一轮的训练迭代，从而极大提到训练结果的准确度。

内循环是会构建自动化测试和评估的工具，不断自动评测和强化学习。

CodeArts Snap关键竞争力三：自动补充背景信息，模型“越听越明白”

大模型能否很好的输出想要的结果的前提是能听得明白，用户的问题是基于自然语言的认知提出来的。CodeArts Snap有大量的可以使用的已知API调用，基于丰富的知识库可以查找类似的实现、相关的数据库表结构、相关的类以及工程的上下文内容，自动补充相关背景信息。此外传递大模型的信息是非常复杂和丰富的，包含各个步骤，需求描述，数据库表，三方件的接口，使用的框架，从历史的项目切片中拿出类似代码，这时大模型就得到了一个充分的知识输入，他会把最终结果给出。这样他听得越明白，推理的结果越准确。

华为云Stack CodeArts Snap智能开发助手不仅提升了研发效率，更为开发者提供了一个全新的工作模式愿，为更多工业企业开启智能研发的新篇章，共创美好的数字化未来。

关注@华为云，了解更多资讯

AI引领下的工业软件开发：提质增效的创新之路

CodeArts Snap关键竞争力一：构建精品研发训练数据，塑造天生高质量模型

CodeArts Snap关键竞争力二：强化训练+评价反馈，模型“越用越聪明”

CodeArts Snap关键竞争力三：自动补充背景信息，模型“越听越明白”

热门阅读

推荐阅读