2023年大数据领域的十大关键议题:数据伦理

发表时间: 2023-11-09 16:00

随着我国大数据产业政策日趋完善、产业基础日益巩固、数据要素市场建设不断深化,大数据产业再次迎来巨大发展空间。在由中国通信标准化协会和中国信息通信研究院联合主办的“2023大数据产业发展大会”上,发布了“2023大数据十大关键词”,分别是湖仓一体、数据资产化、DataOps、数据服务、增强分析、数据伦理、数据基础制度、公共数据授权运营、数据安全风险评估、数据出境。

今天我们来聊一聊“数据伦理”这个关键词。

数据伦理定义

以符合道德准则及社会责任的方式去获取、存储、管理、解释、分析、应用和销毁数据。

数据伦理目标

定义组织中数据处理的伦理规范。

教导员工不正当处理数据会产生的企业风险。

改变或渗透数据处理行为文化。

监管、度量、监控和调整数据伦理准则。

数据伦理准则

1、尊重他人

尊重个人尊严和自主权。不伦理地使用个人数据会直接影响人们之间的相互交往、就业机会和社会地位。准则还要求当人们处于“弱势群体”的情况下,应格外注意和保护他们的尊严和权利。

2、行善原则

数据和信息从业者应识别利益相关方,并考虑数据处理和工作的结果,最大限度地提高效益并最大限度地降低设计过程中造成的伤害风险。

3、公平公正

这一准则可能会提到几个问题:在相似情况下,人们或某一群体是否受到不平等对待?流程或算法结果是否为部分人带来了利益或分配不均?机器学习训练所用数据集是否使用了无意中加强文化偏见的数据?

违背数据伦理行为

4、时机选择

有可能通过遗漏或根据时间将某些数据点包含在报告或活动中而撒谎。例如:在收盘时,人为拉升股票价格。

5、可视化误导

图表和图形可用于以误导性方式去呈现数据。例如:修改比例尺可以使趋势线看起来更好或更糟。

6、定义不清晰

在展示信息时,符合伦理的做法是交代清楚事情的背景及其意义。

7、数据偏见

偏见是一种有倾向性的观点。在个人层面是指不合理的判断与歧视,在统计学中是指有倾向的抽样和选择。

建立数据伦理文化

1、评审现有数据处理方法

理解组织现有数据处理方法在多大程度上直接而且明确的与伦理和合规性驱动因素有关。还应定义员工如何理解现有做法在建立和维护客户、合伙人和其他利益相关方之间信任方面的伦理影响。

2、识别原则、实践和风险因素

原则应与风险(如果不遵守原则可能发生的坏事情)和实践(正确的做法以避免风险)保持一致,通过控制来支持实践。试图进行改善的组织应制定相应原则(需要符合尊重他人、行善原则、公平公正三个准则)。

3、制定适当的数据处理策略

组织可以通过正式制定策略来改善其数据处理方法,制定的策略应包括如下组成部分:价值观声明、数据处理原则、合规框架、风险评估、培训和交流、路线图、审计和监测。

4、采用对社会负责的伦理风险模型

由于组织的社会责任,在执行商务智能、分析和数据科学相关活动时,需要一种超越当前所在组织界限的伦理观念,这会对更广泛的社区产生影响。

数据伦理的技术手段

1、隐私计算

在保护数据本身不对外泄露的前提下实现数据分析计算的技术集合,达到对数据可用、不可见的目的。在充分保护数据和隐私安全的前提下,实现数据价值的转化和释放

2、数据保护

数据行级保护通常指对数据库中所有数据行进行加密或访问控制等安全保护措施。数据行级保护可以针对不同的数据类型和敏感程度,采取不同的加密算法和访问控制策略,以确保数据的安全性和完整性

在数据行级保护中,通常需要对数据进行分类和分级,根据数据的不同类型和敏感程度,采取不同的保护措施。同一个数据报表/数据服务,根据用户属性,通过行级权限管控,实现千人千面,保障数据安全

数据伦理的管理手段

数据安全管理办法是数据伦理的重要管理手段。网络运营者应当按照有关法律、行政法规的规定,参照国家网络安全标准,履行数据安全保护义务,建立数据安全管理责任和评价考核制度。需要制定数据安全计划,实施数据安全技术防护,开展数据安全风险评估,制定网络安全事件应急预案,及时处置安全事件。并且定期组织数据安全教育、培训等。