大数据价值释放:数据共享的关键步骤

发表时间: 2023-12-05 09:54

近日,中国人民大学牵头研制的国家标准《信息技术 大数据 跨域数据可信共享》成功召开了项目启动会。该标准依托于中国人民大学牵头承担的国家重点研发计划重点专项项目《面向城市智能服务的数据治理体系与共享平台》研究成果,旨在给出跨域数据可信共享的参考架构,包括各功能模块和功能要求。

在《信息技术 大数据 跨域数据可信共享》项目启动会上,中国电子技术标准化研究院信息技术研究中心副主任张群,强调了数据共享标准化工作的重要性,指出要明确标准边界。中国人民大学信息学院院长文继荣教授表示中国大数据资源很丰富,国家也成立了大数据局,通过标准让数据共享起来,对未来是至关重要的。在此次启动会上,佳华科技云链大数据中心总工程师侯韶君深入了解标准草案具体内容,并积极参与讨论,分享了佳华科技利用数据共享交换平台产品提供生态环境双碳数据在实际业务中的数据共享实践案例,并在会后以书面形式反馈了相关完善建议。佳华科技的参与和分享得到了与会者的广泛关注和高度评价,佳华实践经验可以为该标准的编制提供具体的参考和支持。佳华科技也将继续积极参与到该标准的编制工作中,为推动跨域数据可信共享贡献力量。

“数据”一词被越来越多的人所提及。主要是因为随着数字化时代的到来,数据已经成为了一种新的生产要素,对于经济增长和社会发展具有越来越重要的影响。2017年,国务院办公厅印发的《关于推进数字经济加快发展的若干政策措施》中,首次将数据作为生产要素,并强调要加快数据要素价值释放。2020年,数据被正式纳入生产要素范围,对于充分发挥数据在经济发展中的作用具有重要意义,国家也陆续出台相关政策,完善了数据要素顶层设计。

当前,全球数据存储量正呈现出快速增长的态势。根据IDC(国际数据公司)的预测,到2025年全球数据总量将达到175ZB。其中,中国数据量增速最为迅猛,预计2025年将增至48.6ZB,占全球数据圈的27.8%。

这种爆发式增长的数据量给数据处理、存储和管理带来了巨大的挑战,同时也为数据共享和数据利用带来了更大的机遇。跨域数据可信共享是保障数据跨组织、跨行业、跨地域有序可信高效流动的一种有效机制,是激活数据要素潜能、释放数据价值的关键。因此该标准得到了众多高校、政府部门和企业的积极响应。

“数据共享”是什么?

数据共享是指在不同用户之间安全、可靠、高效地共享数据的过程。组织按照统一的管理策略对组织内部的数据进行有选择的对外开放,同时按照相关的管理策略引入外部数据供组织内部应用。数据开放共享是实现数据跨组织、跨行业流转的重要前提,也是数据价值最大化的基础。数据共享的目标是减少数据采集等重复工作,打破不同用户之间的数据共享壁垒,从而把重心放在数据关联分析、数据价值挖掘及业务增值开发等领域。

此外,数据共享还可以改善业务流程,使物联网技术可以被整合到组织的业务和运营中,以改善运营效率和减少运营成本。它可以让各种应用程序在不同的环境中提供更好的数据处理能力,这样就可以使多个部门的计算机系统紧密地相互连接和联系。

“数据共享”的优点有哪些?

随着数据量的不断增加,数据孤岛问题不断凸显,即不同的部门或组织之间的数据相互隔离、无法共享,导致数据的重复采集、处理和使用,浪费时间和资源,同时也影响数据的准确性和一致性。

为了解决数据孤岛问题,需要进行数据共享。数据共享在提高数据使用效率、促进数据创新、增强组织竞争力、促进经济增长等方面具有重要意义。

  1. 提高数据使用效率:通过数据共享,可以将数据传递给更多的用户或组织,从而避免数据的重复收集和处理,减少浪费和冗余。这能够提高数据的利用效率,使得数据价值得到更充分的挖掘。
  2. 促进数据创新:在数据共享的环境下,不同的部门或组织可以相互启发和合作,发现新的数据应用和机会,促进数据的创新和发展。
  3. 增强组织竞争力:通过数据共享,可以使组织更好地了解市场需求和趋势,制定更精准的商业策略,更好地管理和利用自己的数据资产,增强自身的竞争力和市场地位。
  4. 推动数字经济发展:数据共享是数字经济发展的重要基础之一,通过数据共享可以促进数据的流通和交易,推动数字经济的创新和发展,推动产业升级和经济结构的优化。

“数据共享”面临的挑战?

数据共享是一项复杂的系统工程,面临着多方面的挑战。

数据质量方面:在数据共享的过程中,数据的准确性、完整性和一致性是至关重要的。如果数据存在质量问题,如数据错误、缺失或不一致,将直接影响数据共享的效果和数据的利用价值,也会给数据来源者造成商业形象和声誉的损失。

数据安全方面:数据共享涉及多方之间的数据传输和存储,安全方面存在漏洞的话,可能出现数据泄漏和滥用,造成相关各方的利益损失;涉密信息和敏感信息的泄漏,还可能威胁国家和公众的安全。

数据权属方面:在数据共享的过程中,参与各方应就数据所有权、数据加工使用权和数据产品经营权等进行明确的约定,并在此基础上承担相应的管理责任,避免出现利益分配纠纷和数据问题无人担责的情况。

经济方面:数据共享需要投入大量的成本,包括数据的收集、处理、存储、传输等多个环节。如果数据共享的成本过高,可能会影响企业的经济效益和市场竞争力,导致数据的流通和交易难以推进。

如何发挥“数据共享”的价值?

在数据共享的推进过程中,普遍存在着“不愿共享”“不敢共享”“不会共享”三个难题。一是由于数据质量参差不齐,以及数据确权定价与利益分配等问题导致“不愿共享”;二是因为数据隐私安全、数据权属和法律责任不清而“不敢共享”;三是由于缺乏标准体系的支撑,采取的处理技术、应用平台各异,数据库接口也不互通,导致了“不会共享”。

为了解决数据共享“不愿”,“不敢”,“不会”的三难问题,国家陆续出台多项信息化建设指导文件,如国务院印发《促进大数据发展行动纲要》《政务信息资源共享管理暂行办法》《“十三五”国家信息化规划》《国务院关于加快推进“互联网+政务服务” 工作的指导意见》《政务信息系统整合共享实施方案》,以及《加强数字政府建设的指导意见》和《全国一体化政务大数据体系建设指南》。这些文件中都明确要求打破信息壁垒和孤岛,采取授权使用等机制解决信息安全问题,构建统一高效、互联互通、安全可靠的国家信息资源体系,打通各部门信息系统,推动信息资源跨部门跨层级共享共用等。而建设安全、高效、精细分工的数据共享交换平台,形成信息资源共享交换体系,为以上问题找到了出路。

数据共享交换平台是一种基于计算机网络构建的信息交换平台,用于实现不同部门、不同区域、不同层级、不同系统、不同业务之间的数据共享和交换。这种平台可以将各个部门、单位、系统、业务的数据进行整合、梳理,通过统一的数据接口或者API,实现数据的共享和交换。它可以提供数据的存储、处理、分析等功能,同时还可以通过技术手段采取有效的措施来保护数据的隐私和安全,可以帮助各个部门、单位、系统、业务之间消除信息孤岛,提高信息资源的利用率,促进数据发挥出最大的价值。

数据共享交换平台具有以下特点:

  1. 统一的数据接口和管理界面,方便用户管理和使用。
  2. 支持多种数据格式和类型,包括结构化数据、非结构化数据、流数据等。
  3. 提供数据的安全保障,通过数据加密、权限控制、访问控制等手段保障数据的安全性。
  4. 支持数据的实时共享和交换,也支持批量数据处理和传输。
  5. 具有数据治理和元数据管理功能,方便用户了解数据的来源、格式、含义等信息。

市面上常见的数据共享交换平台有:(一)国家对地观测科学数据中心。其前身为国家综合地球观测数据共享平台,经过多年的建设,已经形成了可持续、跨机构、一站式的数据共享服务能力,是我国遥感数据的国际交换主渠道。未来将代表国家进行对地观测领域科学数据资源的管理和协调,构建国家级对地观测大数据基础设施。(二)政务数据共享交换平台。例如一网通办,它把政务数据归集到共享交换平台,打通分散的信息和材料,提供政务服务、便民服务、企业服务等类服务,解决企业和群众“办不完的手续、盖不完的章、跑不完的路”等麻烦,提高政府办事效率。(三)云链数据共享交换平台。其采用了云计算和区块链技术,利用去中心化、防篡改、可追溯、高透明等技术优势,确保数据的安全性和隐私性,进一步改善用户的使用体验,增强用户对数据的信任。平台拥有国家网信办颁发的区块链信息服务运营资质,可以提供防伪溯源、数据确权和可信上链存证等类型的服务,为政企客户提供自有数据上链交易通道,实现各行业各领域平台数据安全可信的互联互通。

总体而言,建立数据共享平台是实现数据共享的重要手段。随着数字化转型的加速,各个行业对于数据共享和交互的需求都在增加。同时,人工智能和大数据技术的融合,以及边缘计算的发展,也为数据共享平台提供了新的机会。人工智能和大数据技术可以帮助数据共享平台提供更智能化的服务和应用,如机器学习、自然语言处理等。而边缘计算则将计算和存储资源推向网络边缘,提供更低延迟和更稳定的服务,满足实时性和数据安全性的需求。

数据汇聚力量,共享成就未来。在数字化时代,数据已经成为一种重要的资产和资源,而数据共享则是释放大数据价值的关键环节,也是推动数字经济发展的重要支撑。已立项国家标准《信息技术 大数据 跨域数据可信共享》涵盖了从数据发布、元数据查询到数据使用、数据溯源和数据审计的整个过程,解决了数据价值释放与安全隐私保护的矛盾,实现了以对象为中心的跨域数据共享和可信数据交换等问题,推进数据的开放和共享,规范数据使用和授权,加大数据监管和执法力度,促进创新和发展。在未来,我们需要进一步加强数据共享的研发和应用,释放更多的数据价值,为推动数字经济的发展作出更大的贡献。

来源:36氪财经