数据要素遇上人工智能：安全防线的三大挑战解析

发表时间: 2024-06-06 17:30

21世纪经济报道记者肖潇北京报道

“AI大模型是底层的基础设施，我们需要为它做一整套纵深的安全体系。终端、网络、云上、应用……各个层面都要做好防御才行。这也是为什么今天的数据安全特别难做。” 6月5日，奇安信集团（上交所：688561）副总裁、首席数据安全科学家刘前伟在“第四届中国数据要素50人论坛”上表示。

作为网络安全公司员工和数据安全专家，刘前伟发现在大模型井喷后，网络安全碰到了三个前所未有的难题：

首先，生成式AI打破了“攻防平衡”的网络安全格局。刘前伟解释，尤其是代码大模型的普及，让以往低水平的黑客如今也能用AI生成高级攻击的脚本，打破了一直以来的网络安全防线。一个军事概念“饱和攻击”或许能形容眼下的安全攻击局势，即高密度、持续性的黑客攻击，这反过来对作为“防守方”的安全专业人员提出了更高要求。

第二，人工智能加剧了数据非法获取、恶意滥用的风险。“数据既是黑客窃取的目标，也可能是攻击的毒药。”刘前伟说，数据一旦被投毒会产生更严重的安全问题，比如网络安全类厂商的数据标注一旦被篡改，攻击样本被篡改为正常样本，“解毒”就成了“投毒”。

除此之外，敏感数据的泄露风波不断。一个典型案例是去年4月，三星集团被曝光多起数据泄露事件。根据韩媒报道，原因是三星允许半导体部门的工程师使用ChatGPT修复源代码问题，起码有三名员工直接输入了新程序的源代码本体、与硬件相关的内部会议记录等数据。这些敏感信息以提问的方式输入给ChatGPT，进入其训练数据库，从而泄露给了美国公司以及其他用户。

尽管尚没有发生滥用事件，但泄露本身已经令人不安。美国数据安全公司Cyberhaven曾统计160万员工使用AI的情况，发现3.1%的打工人曾直接将公司内部数据喂给ChatGPT分析。其中，一周内，有10万名员工上传了199份机密文件、173份客户数据和159次源代码。

棘手之处尤其在于，由于数据一旦投喂给AI大模型就难以被“撤回”，即使是三星这样的大型企业，也难有办法要求OpenAI直接删除公司的敏感数据。

第三，人工智能扩大了数据暴露面，数据要素的流通风险激增。刘前伟指出，一方面，随着大量企业业务走向数字化，企业数据在终端、应用、云上、数据中心之间流转，链路非常复杂，访问者的身份往往难以辨认和管理；

另一方面，过去的网络诈骗简单好防，如今的不法分子可以利用深度伪造技术模仿出声纹、人脸。“能够披着合法的外衣做坏事，很难及时捕捉到安全风险。”刘前伟无奈表示。

那么，如何才能完善人工智能冲击下的网络安全体系？刘前伟认为，需要在最开始就将安全能力内嵌到整个AI业务系统中，建立全方位的安全防御体系；他还提到，可以用AI技术来提高数据要素平台本身的安全性，尤其要升级对API接口的保护，这是去年90%数据安全事件的肇因；最后，可以分离调试环境与运行环境，先在调试环境中用少量样本训练大模型，再放入全量环境中，在不影响安全性的同时释放数据价值。

更多内容请下载21财经APP

数据要素遇上人工智能：安全防线的三大挑战解析

热门阅读

推荐阅读