智库头条 | 人工智能主权化:发展与隐患

发表时间: 2024-05-30 09:44

摘要

在当前世界地缘政治形势愈发紧张、国家互信持续走低的情况下,加之飞速发展的人工智能技术所具有的强大颠覆性力量,主权人工智能(Sovereign AI)的概念成为国家关注的重点。诸多国家已经针对主权人工智能发布了相关的政策,其中发达国家更加关注自身大语言模型的建立,以更好的保护自身的文化、语言和价值观,而全球南方国家则着力关注自主基础设施建设,以保护自身发展不依赖其他国家。此外,英伟达等科技公司正在积极介入并推进人工智能主权化的进程。

图源:Microsoft Copilot(生成式人工智能)

人工智能技术在不断的发展中已经衍生出了诸多新概念,人工智能主权是其中的重要代表,该概念至今并没有广泛认可的定义,但是已经有诸多单位及个人提出了相关论述。牛津大学教授Woods Andrew Keane提出数字主权是一个国家对其数字技术发展的控制。Silicon Corner提出由于数字技术塑造了越来越多的重大政治、经济、军事和社会现象,数字主权概念出现并流行,而人工智能主权是其重要的分支。英伟达创始人兼首席执行官黄仁勋指出该概念指的是一个民族国家发展人工智能基础设施的同时保护其文化和语言的能力。Unite AI认为人工智能主权概括了一个国家发展符合其核心价值观的人工智能的雄心和能力,目的是维护其数字主权和安全,它的出现是源于各国在人工智能领域的低信任度。甲骨文公司则认为主权人工智能是指与数字主权框架相一致的人工智能技术的开发和部署。该概念的本质是对技术的控制能力,大致指国家支持人工智能基础设施建设,用符合本国文化和思维方式等的数据训练大模型,支持本地产品形成生态系统等。



人工智能主权化现象源自当前时期大国竞争的加剧,国家之间的战略互信降低,加之数字技术已经更加深入的嵌入社会生活,因此数据和信息技术安全成为国家安全的重要方面,国家不得不考虑人工智能及其他信息技术领域相互依赖带来的风险。同时,国家之间目前有着一定的意识形态、价值观冲突,而人工智能技术,尤其是当前正在火热发展的生成式人工智能技术,具有很强的塑造偏见和传播价值观的能力,因此国家需要保证其发展能够符合本国价值观。美国顶级智库新美国安全中心(CNAS)专家Pablo Chavez指出,世界正在经历第二波人工智能浪潮,此前第一波是由包括各类大型科技跨国公司和新兴初创公司在内的私营部门推动的,而第二波浪潮的主要催化剂是政府对人工智能的参与。在此背景下,人工智能主权化的趋势越来越受到各国政府的关注,诸多国家政府也已经对其做出了反应和部署,在全球人工智能竞赛不断加速的背景下,利用国内技术开发大规模的人工智能模型是保护人工智能主权的重要手段。



印度方面,其国家电信部部长Rajeev Chandrasekhar指出,数字公共基础设施(DPI)方面,印度正在寻求通过开发该国自己的主权人工智能基础设施来塑造人工智能的全球趋势和对话。他认为,要建立印度主权人工智能,就必须先建立一个人工智能生态系统,并且通过研发印度专属的数字公共基础设施时期本地化,同时需要促进政府全面支持,并且建立相应的数据管理平台。在认识到主权人工智能重要性之后,印度采取了一系列措施,与IBM建立合作谅解备忘录,准备合作建立在人工智能技能和生态系统开发,以及在生成式人工智能功能方面建立先进的印度基础模型;其联邦部长Rajeev Chandrasekhar与英伟达负责企业销售和业务发展的高级副总裁Shankar Trivedi会晤中就主权人工智能的合作领域进行了探讨,表示印度的数字公共基础设施(DPI)可用于构筑其主权人工智能。印度还表示,将把印度堆栈项目将其所获得的系列数字公共服务的大量数据整合到主权人工智能技术的研发中,将提供这类数据以协助开发人工智能和大预言模型,建立公私合作伙伴关系,以支撑主权人工智能发展。其已经发展了诸多针对各类地方语言文化的大语言模型,如Navarasa 2.0、Odia Llama、Kannada Llama等。


日本方面,当前富士通公司已经在和甲骨文公司合作在日本提供主权云和人工智能相关服务。英伟达的黄仁勋表示,日本应该打造自己的人工智能,他认为日本的数据、语言非常具体,文化也非常具体,没有理由允许其他第三方获取这些数据,创建人工智能,然后将其导入日本,日本应该自己建造自己的人工智能。当前日本电报电话公司(简写为NTT)自2024年3月开始向旨在提升运营效率和数字化转型的企业提供其专有的日语大语言模型“tsuzumi”;而且日本国立情报学研究所(NII)信息与系统研究机构小组正着手在研发日本的大语言模型,该小组由包括研究人员在内的 500 多名参与者组成,自2023年5月起,在大学和企业中从事自然语言处理和计算机系统方面的研究;此外,LINE也宣布推出其新的日语大语言模型。


韩国方面,其国内已经推出了韩语大语言模型HyperCLOVA X,该模型是世界上第三个向公众开放的超大规模人工智能语言模型,特点是其高质量的数据,其数据包括来自 NAVER Blog、Café 和 Knowledge-iN 的各种用户生成的韩语内容,这些内容在用户同意的情况下进行了长达 20 多年的收集,其训练数据比GPT-3大6500倍,并且包含韩国文化和生活方式的相关信息;NAVER Cloud在构建适合韩国文化的人工智能模型方面投入了大量资金,其希望构建一个韩语社会偏见数据集“KoSBi”。该数据集可用于训练安全句子分类器,以过滤和减轻大语言模型中的社会偏见。NAVER Cloud拥有多台超级计算机,足以训练超过100B参数的大语言模型,并在维护基础设施方面拥有多年的运营经验。而且其还拥有韩国最大的AI数据中心,正在尝试开发最佳的AI半导体,以为HyperCLOVA X提供安全、高质量的基础设施。



同时,韩国政府认识到,在各行业推广和使用人工智能技术是恢复韩国经济活力和解决社会问题的重要路径。2019年12月,公布了《国家人工智能战略》,打造世界领先的人工智能生态系统,并持续投入,将国家建设成为人工智能强国。其规定的主要任务包括在全国重点地区建立人工智能创新集群,拓展大规模高性能计算资源,推动人工智能基础研究投入和下一代智能半导体先行开发,将人工智能素养和跨学科教育贯穿教育课程,以及建立人工智能研究生院来培养人工智能专家。此外,2023年4月,韩国科学和信息化部公布了《增强超大规模人工智能竞争力计划》,该计划将在迄今为止在人工智能领域取得的成就的基础上,增强国产大型语言模型的竞争力,并将基于大语言模型的生成式人工智能培育为未来的重点战略产业。韩国计划在 2023 年开始投资约 4000 亿韩元(约合 3 亿美元),并在未来 10 年内继续持续投资。



在政府的积极支持下,韩国工业界也在积极进行实验和投资,以提升生成式人工智能的全球竞争力、开发新业务并拓展海外市场。SK Telecom、LG 和 Naver 等领先公司一直在推进超大规模人工智能语言模型和构建人工智能生态系统,同时与政府和云平台运营商合作的人工智能硬件公司,如 Sapeon、Rebellions 和 Furiosa AI,也正在崭露头角。



在由韩国AI初创公司举办的亚洲有史以来最大的生成式人工智能活动Generative AI Asia 2023 会议上上,Naver Cloud 超大规模人工智能负责人 Sung Na-ko 表示,“如果韩国无法打造自己的人工智能技术,梯子就会被踢掉,这将使我们未来不可能拥有这种能力”。


印度尼西亚方面,印度尼西亚的indosa公司与英伟达确定合作开发人工智能主权技术,以首席执行官兼总裁 Vikram Sinha 为代表的 Indosat Ooredoo Hutchison 集团在 2024 年巴塞罗那世界移动通信大会上与英伟达电信高级副总裁 Ronnie Vasishta 签署了一份谅解备忘录,为创新和数字化的新时代奠定了基础。签署后,Vikram表示,此次合作标志着印度尼西亚成为全球人工智能驱动的数字国家的关键时刻。通过这一历史性合作,Indosat 和 Lintasarta 成为首个 NVIDIA 云提供商合作伙伴,为印度尼西亚地区的企业带来英伟达 的全栈(full stack) AI 平台,并通过连接公共互联网的高密度数据中心提供英伟达的尖端GPU 技术。超级计算机现已成为关键基础设施,Indosat 和英伟达的合作将为印度尼西亚成为人工智能国家奠定基础,该集团将利用其数据中心打造主权人工智能平台,建立印度尼西亚自身的数字基础设施,并推动整个生态系统的创新,推动印度尼西亚的数字经济增长,为数字行业的蓬勃发展奠定了坚实的基础。


新加坡方面,其耗资 7000 万新元建立旗舰人工智能计划,该计划由新加坡国家研究基金会 (NRF) 资助,由新加坡信息通信媒体发展局 (IMDA) 与新加坡人工智能 (AISG) 和新加坡科学技术研究局 (A*STAR) 合作推出国家多模态大语言模型(NMLP),利用国家超级计算中心(NSCC)的高性能计算(HPC)资源,增强国家在人工智能(AI)研究和创新方面的能力,该计划将发展新加坡在多模态大语言模型方面的研究和工程能力。该模型其是东南亚第一个大型语言模型生态系统,以 AISG 最近推出的 SEA-LION 模型的早期成果为基础,是一种开源大语言模型,更能代表东南亚的文化背景和语言特征,能够满足东南亚地区地区的多元化文化和语言需求。此外,新加坡电信公司也与英伟达合作,将在东南亚地区建立数据中心,保障主权人工智能发展。


阿联酋正在与甲骨文公司合作以增强其人工智能能力,并打算在其OCI 专用区域(Oracle Dedicated Region Cloud@Customer)部署 NVIDIA H100 Tensor Core GPU 集群。e& UAE 首席技术和信息官 (CTIO) Khalid Murshed 表示:“OCI 将使我们能够在 e& UAE 数据中心托管的我们自己的 OCI 专用区域内部署 NVIDIA H100 GPU 集群。这种类型的本地化将使我们能够加速整个阿联酋的人工智能创新,并帮助我们大规模开发新一代人工智能应用程序和用例。这符合 e& UAE开拓创新、塑造技术未来的转型努力,我们致力于推动人工智能领域的卓越发展。”此外,阿联酋阿布扎比穆巴达拉投资公司董事总经理表示,本年度将向人工智能发展投入大量资金。


巴西方面,其虽然在技术发展等方面仍然没有迈入一线行列,但是其已经开始着手关注主权人工智能的发展,巴西圣保罗企业管理学院(Fundação Getulio Vargas,FGV)法学院教授Luca Belli通过研究,提出了关键人工智能主权推动因素(KASE)框架,认为在KASE领域拥有强大能力的国家不仅能够更好地保持对其人工智能技术、政策和数据的控制,而且还可能提高其技术相关性,减少对外部来源的依赖,并维护其国家利益和在人工智能领域的自主权。缺乏这种能力的国家需要彻底重新考虑其人工智能战略方法,以尽量减少对人工智能依赖的相当大的风险,因为这种风险可能会加剧已经持续的数字殖民化现象。


法国方面,法国有史以来最大的新人工智能大语言模型Cedelle已经获得了巨额欧洲投资,其AI领跑企业Mistral AI也尝试推出了新的大语言模型,旨在与 OpenAI 的ChatGPT 竞争。法国总统马克龙在巴黎“科技万岁”科技创新展开幕式上宣布,将投资超过5亿欧元用于发展人工智能,为其打造世界级产业群。政府还将投资5000万欧元升级现有的让-扎伊超级计算机项目,他希望法国大力发展生成式人工智能和开源大语言模型,并鼓励建立法语数据库。


德国承诺到 2024 年斥资近 5 亿欧元用于人工智能 (AI) 研究和创新,投资于超级计算基础设施、技能开发、女性领导的研究小组和 150 个新教授职位。德国研究部长 Bettina Stark-Watzinger表示新的人工智能行动计划是实现技术主权并避免依赖外部势力的一种方式。德国副总理兼经济事务部长Robert Habeck也在投资新闻发布会上强调了支持国内人工智能企业的重要性。他认为在人工智能领域拥有自己的主权非常重要,如果欧洲有最好的监管,但没有欧洲自己的公司,欧洲就没有取得优胜地位。此外,德国也开始了大语言模型研发,其本土公司Aleph Alpha 正在构建一个类似于 OpenAI 的 GPT-4 的大型语言模型 (LLM),也已经得到欧洲巨额投资。


荷兰正在构建自己的大语言模型GPT-NL,旨在提供透明、公平和可验证的AI聊天机器人。该模型由研究组织 TNO、荷兰法医研究所和 IT 合作组织 SURF 开发。TNO 表示:“随着 GPT-NL 的推出,我们国家将很快拥有自己的语言模型和生态系统,这是根据荷兰价值观和指导方针开发的。”此外,GPT-NL 将连接到该国的国家超级计算机 Snellius,该计算机提供模型运行所需的处理能力,该模型已经获得欧洲融资。荷兰数字化部长 Alexandra van Huffelen表示:“我们希望保留荷兰的价值观和繁荣。我们不愿意将荷兰未来的社会经济安全完全交给大型科技公司。我们需要一个具有基于公共价值观和我们目标的雄心和愿景的政府,确保每个人都可以参与数字时代,每个人都可以对数字世界充满信心,每个人都可以掌控自己的数字生活。我们在现在阐明我们的原则,我们将在未来保持控制。”


英国方面,人工智能主权化正在被热烈讨论并进行推进。英国主要政府人工智能 (AI) 供应商Faculty的首席执行官马克·华纳(Marc Warner)敦促英国应该为英国安全服务建立一个与 ChatGPT 竞争的产品。表示英国希望在国防领域对这项技术拥有“尽可能多的控制权”。前首相托尼·布莱尔及其研究所表示,人工智能最终可能“提供广泛的公共服务”,认为政府应该在人工智能发展中发挥更大的作用,以确保英国在该领域拥有主权能力。在持续的呼吁下,英国首相里希·苏纳克 (Rishi Sunak) 和技术部长米歇尔·多尼兰 (Michelle Donelan)承诺投入1 亿英镑(约合 1.245 亿美元),用于建立基金会模型工作组。该团队将开发人工智能,理想地使该国具有“全球竞争力”,保护其人工智能主权。


新西兰领先的信息管理服务提供商 TEAM IM 选择 Oracle Alloy 来构建新西兰第一个本地拥有和运营的超大规模云,称为 TEAM Cloud。New Zealand AI认为,主权人工智能对新西兰至关重要,因为它提供了利用人工智能技术优势的途径,同时确保它们符合国家的价值观、法规和利益。它支持经济增长、国家安全、道德发展、数据主权、国际合作和劳动力发展,使新西兰成为全球舞台上道德和创新人工智能发展的领导者。


当前人工智能主权化已经处在蓬勃发展阶段,诸多国家已经开始着手发展人工智能主权相关的基础设施和技术。在各类国家中,非常明显的趋势是大部分发达国家,包括法国、德国、荷兰、韩国等国家,都非常注重投资和发展自身的大语言模型,以在数字时代进一步保护自身独特的文化特质、语言特性和价值观,这类国家对数据安全、价值观安全等高度关心。与此同时,全球南方国家更加注重对技术设施和关键技术的掌控。印度等国家与英伟达、甲骨文等公司签订的各类合作协议大多涵盖数字基础设施的建设。巴西圣保罗企业管理学院(Fundação Getulio Vargas,FGV)法学院教授Luca Belli指出对于全球南方国家来说,人工智能主权应该是一个政策重点。根据其提出的KASE框架,人工智能主权能使各国能够抵御可能的不利条件,包括外国监管的域外影响、外国制裁及日益频繁的供应链中断等。全球南方国家关注的重点是国家战略、经济、技术发展的稳定和长期供应,追求人工智能主权化是为了为自身发展创造更好的便利条件。



但是,人工智能主权化的趋势同时也带来了分裂世界的风险。UNITE AI提出,其主要风险是可能加剧全球不平等、两极分化和冲突。国家在寻求人工智能主导地位的过程中,可能出现新的差距,这可能会加深现有的分歧,并带来新的地缘政治紧张局势。意识形态的差异也可能导致人工智能主权化产生更大的地缘政治影响,Brookings认为这将加剧不同意识形态之间的成见,进一步阻塞沟通渠道,加剧不信任和地缘政治竞争,同时可能导致技术生态系统的巴尔干化,其已经开始初步显现的结果是中国、美国和欧洲等不同网络及其数字生态系统的出现,每个网络都有自己的规则和治理特质,从长远来看,这可能意味着就如何监管和治理更复杂形式的人工智能达成一致将变得更加困难。文化层面来看,不同文化语境的AI出现,可能导致不同文明之间的偏见不断加深,从而进一步恶化歧视,持续造成误解,进而阻碍全球化的深入发展。此外,IOL还提出,不是每一个国家都有能力获得人工智能主权,人工智能主权化趋势可能进一步扩大数字鸿沟,GARNEGIE也认为并非所有国家都能够制定和实施必要的战略、政策和制度变革,从而建立人工智能主权。对于通常依赖外国技术的发展中国家来说,这样的努力可能尤其艰巨。最终,在 KASE 领域拥有强大能力的国家不仅能够更好地保持对其人工智能技术、政策和数据的控制,而且还可能提高其技术相关性,减少对外部资源的依赖,维护其国家利益和利益。缺乏这种能力的国家需要彻底重新考虑其人工智能战略方法,以尽量减少依赖人工智能的巨大风险,这种风险可能会加剧已经存在的数字殖民现象。



另一值得关注的是人工智能主权化现象中科技公司的广泛介入。主权人工智能的概念事实上正在被英伟达、甲骨文这类公司广泛使用,英伟达CEO黄仁勋多次针对不同国家,从不同角度对主权人工智能发表观点,黄仁勋曾建议根据每个国家的需求定制AI模型,当被问及如果他是一个发展中国家的领导人,他会怎么做时,他说:“当然,我会做的第一件事就是将语言、文化数据编入你自己的大型语言模型中。这类观点也被IBM、甲骨文等公司关注和支持。目前,印度、阿联酋、新西兰、日本等国家已经与英伟达开始相关合作,同时英伟达也和甲骨文就开发主权人工智能发展项目达成了合作。ARSTechnica提出,事实上每个国家都拥有自己的人工智能基础设施的概念对这类公司来说非常有利,因为这意味着其人工智能相关硬件产品的市场将遍及全球每个国家。由于科技行业可能正处于深度学习人工智能技术采用曲线的起点,主权人工智能概念的普及可能会在不久的将来为英伟达等公司带来巨大的增长。本文作者:曲子寰

编辑:钟文