2024年5月16日,华为混合云研发生产线总监赵子武在华为AI+制造行业峰会上发表《提质增效,AI赋能软件开发创新》主题演讲,详细介绍基于华为云Stack的CodeArts软件开发生产线,基于华为多年研发最佳实践和工具,覆盖软件开发全生命周期服务。
2024年,基于华为云Stack混合云的CodeArts迎来全新升级,新增盘古研发大模型加持下的CodeArts Snap智能开发助手,提供代码生成、研发知识问答、单元测试、代码解释、代码注释、代码调试、代码翻译和代码检查等核心八大特性,帮助开发者端到端提升研发效率超过20%。
会上,赵子武详细介绍了CodeArts Snap智能开发助手的3大关键竞争力:
华为云Stack构建一整套开发工具链、基本法和自动化平台,基于1.5万亿开源研发数据以及华为各产品线代码,精心筛选出了500亿Token精品研发数据。
基本法包含三个内容:第一个模型的语料质量,只有进行清晰高质量的问题,大量正确的背景知识,以及能够明确的表达出自己的要求,最后输出来的结果才可能是对的。第二个就是清洗出来的数据是高质量的,清洗的过程是有序的,数据是有保障的。第三是评测基本法,训练出来的代码生成模型,要有清晰的评价标准,要有一套比较中立的,比较专业的一种方法去评测,而不是靠主观来评价。
有了基本法之后,CodeArts Snap也建立了两个自动化的工具平台,一个是自动化的数据清洗平台,一个是自动化的模型评测平台,支撑持续高效运营,保证模型训练持续优化。
好的评估机制可以对模型进行强化学习,基于这套强化学习的逻辑,让研发大模型的代码生成能力更强。采用内外循环的方式来迭代优化我们的训练数据,从而让这个模型越训练越聪明。
外循环是指用户使用的时候,系统会收到用户评价和反馈,比如是否接受完全结果,还是不接受或者部分接受。将这些数据集注入到到下一轮的训练迭代,从而极大提到训练结果的准确度。
内循环是会构建自动化测试和评估的工具,不断自动评测和强化学习。
大模型能否很好的输出想要的结果的前提是能听得明白,用户的问题是基于自然语言的认知提出来的。CodeArts Snap有大量的可以使用的已知API调用,基于丰富的知识库可以查找类似的实现、相关的数据库表结构、相关的类以及工程的上下文内容,自动补充相关背景信息。此外传递大模型的信息是非常复杂和丰富的,包含各个步骤,需求描述,数据库表,三方件的接口,使用的框架,从历史的项目切片中拿出类似代码,这时大模型就得到了一个充分的知识输入,他会把最终结果给出。这样他听得越明白,推理的结果越准确。
华为云Stack CodeArts Snap智能开发助手不仅提升了研发效率,更为开发者提供了一个全新的工作模式愿,为更多工业企业开启智能研发的新篇章,共创美好的数字化未来。
关注@华为云,了解更多资讯