2023年大数据领域的十大关键词:湖仓一体、数据伦理、数据出境等
发表时间: 2023-06-26 22:05
数据作为新型生产要素,是数字化、网络化、智能化的基础,已经快速融入生产、分配、流通、消费和社会服务管理等各个环节,深刻改变着人们的生产生活方式。近年来,我国大数据产业政策不断推陈出新,产业基础日益巩固的同时,数据要素市场建设也日益深化。基于对产业的研究与观察,中国信通院在6月26日举办的“2023大数据产业发展大会”上,发布了《2023大数据十大关键词》,研判当前大数据产业发展的热点和方向。2023大数据产业发展大会现场 证券日报记者郭冀川/摄
关键词一:湖仓一体,数据平台发展进入融合一体化新阶段随着移动互联网飞速发展,为满足多种数据类型存储、多场景分析等业务诉求,部分企业采用在一个数据平台之上混合部署数据湖和数据仓库。中国信息通信研究院云计算与大数据研究所所长何宝宏介绍,这一湖+仓混合架构存在存储成本高、时效性差、易出现一致性问题、开发运维难度高四大问题。为解决这一问题,湖仓一体技术应运而生,据介绍,湖仓一体是融合数据湖与数据仓库的优势,形成一体化、开放式的数据处理平台,打破了数据仓库与数据湖之间的壁垒,构建在数据湖低成本的数据存储架构之上,同时具备数据仓库的数据处理和管理能力。近年来,数据资产化实践不断深化,2022年12月份,中共中央、国务院印发《关于构建数据基础制度 更好发挥数据要素作用的意见》(下称“数据二十条”),提出通过数据商,为数据交易双方提供数据产品开发、发布、承销和数据资产的合规化、标准化、增值化服务,促进提高数据交易效率。数据权属方面,以数据交易所和知识产权局为代表的机构提出了数据资产登记的要求,为数据资产规范交易奠定基础。数据估值方面,数据资产估值的目的和对象逐渐清晰,企业关注点从数据应用价值视角向数据资本视角转移。何宝宏举例介绍,光大银行根据前期的研究基础,完成对贵阳移动金融发展有限公司授信1000万元,是数据估值实践的一大突破。数据研发运营一体化(DataOps)是数据开发的新范式,它打破协作壁垒,构建集开发、治理、运营于一体的自动化数据流水线,不断提高数据产品交付效率与质量。何宝宏表示,随着产业实践与理论研究发展,DataOps已从模糊的概念期逐步演化至落地实践阶段。数据中台的重要职能是面向业务方提供基于数据的自助分析、模型管理、接口调用、指标和标签管理等多样化的能力支持。数据服务是数据中台对外进行能力输出的出口。何宝宏介绍,数据服务体系的建设可使业务方更为便捷的检索并获取所需要的数据内容,从而更好地发挥数据中台的赋能价值。智能增强型数据分析工具是通过机器学习、自然语言处理等智能化技术提升数据分析流程中的数据准备、洞察发现、结果输出共享三方面能力,从而提升数据分析工作的自动化程度。据悉,这一概念于2017年提出,但受限于当时的AI技术水平,该领域并未取得突破性的发展。随着2023年AIGC技术的火热,其在数据分析领域的应用正受到各方关注。关键词六:数据伦理,国家数字经济治理体系重要组成部分大数据、人工智能等新技术的蓬勃发展促进了科技创新和经济发展。但大数据应用的负面效益也不容忽视,如大数据杀熟、隐私数据泄露等。自2021年开始,我国针对数据安全、个人信息保护、科技伦理等问题陆续出台多项法律法规旨在搭建数据伦理治理框架,持续推进科技向善发展。何宝宏表示,“数据二十条”具体提出了适应数据特征、符合发展规律、彰显创新引领的数据基础制度体系,具有独特的政策设计,即以基础制度破解数据要素价值释放中的基础性问题。何宝宏说,保障权益、合规使用的数据产权制度;合规高效、场内外结合的数据要素流通和交易制度;体现效率、促进公平的数据要素收益分配制度;安全可控、弹性包容的数据要素治理制度,这四大制度构成了数据基础制度的“四梁八柱”,为进一步推动数据要素价值释放指明了方向。中国信通院统计,北京、海南、贵州、成都等地区积极开展各类创新实践探索,基本形成了公共数据的授权运营模式。公共数据管理机构进行资源整合,统一推进开发利用,授权运营机构或加工方进行数据处理加工,以产品或服务的形式进入市场,提供给应用方。关键词九:数据安全风险评估,数据安全治理的重要抓手数据安全风险评估作为数据安全治理能力提升的关键环节,一方面受国家各项政策驱动备受关注,另一方面随着数据泄露等事件的愈演愈烈,基于风险防范目标而开展的数据安全工作也成为业务数字化健康发展中的必选题。数据安全风险评估正在成为数据安全治理的重要抓手。2023年6月1日《个人信息出境标准合同办法》的正式施行,数据出境话题引发热议。何宝宏说,自第一版《数据出境安全评估申报指南》发布,各省市积极跟进响应,或开展解读活动,或发布当地申报指南,为出境评估工作的顺利开展探索实践路径。同时,个人信息保护认证、个人信息出境标准合同办法也进入大众视野。三条出境路径各有适用场景,互为补充,为数据出境工作的落地实践提供指导。2023大数据领域的十个关键词,涵盖政策、理念、安全、技术等支撑数据要素价值释放的方方面面,表明我国大数据产业已形成健康有序的发展格局。何宝宏说,数据从计算机语言到成为生产要素的全生命周期包括七个环节,分别是数据资源化、数据治理、数据资产化、数据开发应用、数据流通、数据要素市场建设、数据安全。2023大数据十大关键词中有四项分布于数据开发应用环节,两项分布于数据要素市场环节,两项分布于数据安全环节,体现出了今年发展的重点在于数据的业务赋能与内外部融通,以及继续夯实安全基础。