文 |潘程
编辑 |真梓
2023年,大数据合规交易的热闹似乎还在继续。
最近,北方大数据交易中心在天津揭牌成立,尝试通过一种“新的知识数据产品”在垂直领域进行变现;而贵阳大数据交易所则与南方电网及相关技术方合作,希望通过电力数据与产业数据融合,为金融机构提供决策辅助等支持;广州数据交易所则上线了集成式算力资源共享平台,面向16个重点行业密集发布近40款数据产品。
从这波操作中不难发现,曾经在各细分领域中建树不多的数据交易所(中心),在持续找寻突破。
其实在2021年左右,国内数据交易所就如雨后春笋般出现。产生这一现象的首要原因,与近几年密集发布的政策有关。
2020年4月,中央文件《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》正式将“数据”划归为第五大生产要素;2022年12月,“数据二十条”进一步明确了国家将建立合规高效、场内外结合的数据要素流通和交易制度;今年3月,国家数据局的组建,则将主要职责设定为负责协调推进数据基础制度建设等。
而今年还有一个更大的不同,便是随着AI大模型爆火,“数据”的热度正不断攀升。
《中国人工智能大模型地图研究报告》统计显示,目前国内已经发布了79个参数规模在10亿以上的大模型。而且有研究团队认为,在AI三要素(算法、算力、数据)中,数据是直接影响大模型在垂直行业落地效果的关键。
北京、深圳也已陆续发布AI相关支持政策。
5月30日,北京市提出将“加强公共数据开放共享”、“推动公共数据与市场化数据平台对接”等作为主要任务之一;5月31日,深圳市强调将“培育高质量数据要素市场”、“研究出台数据要素市场培育政策措施,进一步做大深圳数据交易所交易规模”。
据36氪不完全统计,从2020年4月至今全国各地新成立的大数据交易所(中心)已有20余家。它们纷纷将重点投向解决此前数据交易过程中数据安全难保障、场内交易难持续、撮合模式附加值太低等困境。
但过去几年的实践表明,从根本上破除数据交易中的一系列难题并非易事。
对数据交易所而言,探索出成功的市场化经验是一直以来的目标。
2015年4月,贵阳大数据交易所作为全国第一家交易所,曾被寄予厚望。彼时,在贵阳市政府的支持下,贵阳大数据交易所确定了“布局全国30家交易中心”的战略,并以“汇集1万家大数据交易会员、每年数据清洗交易量1万PB、大数据交易年总额3万亿、围绕交易所平台的创业公司超过1万家”作为中长期目标。
贵阳大数据交易所高管甚至畅想,“如果有一天,数据的交易体量非常大了,也许会跟证券、期货等相媲美。”
而事实上,贵阳大数据交易所的实际交易额与曾经定下的目标相差了2000多倍。
今年5月27日的一组最新数据显示:贵阳大数据交易所累计集聚“数据商”“数据中介”等市场主体589家,上架交易产品1017个,累计完成交易776笔,累计交易额达13.87亿元。
或许,贵阳大数据交易所的经历已经说明理想与现实之间的差距,那是用八年时间都较难弥合的。
最先,贵阳交易所也曾探索过交易佣金制,但很快便遇到交易规则问题。
由于场内数据交易在2015年还是一个新鲜事物。它所具有的“新鲜、低频”特点,再叠加当时数据确权难、定价难,市场交易主体互信难、入场难、监管难等一系列痛点,导致交易所很难从交易佣金(按单次交易金额收取佣金)的模式中获得利润。
于是,贵阳大数据交易所在2016年切换成了“增值式交易服务模式”,即交易平台跳出中间人身份,部分承担数据清洗、数据标识、数据挖掘、数据融合处理等数据服务商的职能和角色。但在一些观点看来,这一定位与众多数据科技公司的功能重合,导致交易所始终没有独特性。
其次是数据质量和数据产品形态问题。早期不少数据产品的数据来源复杂,有政府公开数据,有企业内部数据,也有网络爬虫数据等。这些数据质量参差不齐,导致相应的数据产品质量不高且难以标准化。
数据产品的形态在多年内也进展不大。即便当前已是2023年,但市面上的主流产品依然以数据集、数据包以及数据报告为主,辅以数据服务和数据工具,产品形态相对简单、溢价空间较低。
比如贵阳大数据交易所的数据产品,就包含数据集、离线数据包、数据服务等,在此基础上又叠加了算力和算法模型的相关产品;深圳数据交易所的数据产品则有API数据、加密数据、数据集、数据分析报告、数据应用程序等,在此基础上又增加了数据服务和数据工具两大类;上海数据交易所的产品也以数据集、数据服务两大类为主。
此外,数据安全问题依然严峻。
最新的《2023年Q1数据资产泄露分析报告》显示,“Q1发生近1000起数据泄露事件,涉及1204家企、38个行业,黑产的数据交易主要集中在更加隐蔽和便利的匿名社交平台。”而未来,各地的数据交易所能否在安全问题上把好关,仍是个长期挑战。
要解决上述难题,如今各家的探索还处于起步阶段。
2022年,深圳交易所通过引入隐私计算技术,开启探索数据要素的安全流通。深圳数据交易有限公司副总经理王腾曾透露,要“运用隐私计算、区块链等关键技术,将有效限制敏感数据被无限复制,防止数据泄露和滥用,增强数据的共享意愿”。
上海数据交易所则把视野投向国际市场,并于近日公布数据出境安全评估案例,通过在国际板中组织全球的合规数据产品流通交易,为国际企业的“引进来”和国内企业的“走出去”服务。
而北方大数据交易中心,则表示自己试图带动垂直领域中交易三方(供给方、需求方、平台方)共建共享生态的方式,将数据转化为资产并让数据产品自然留存到北数的平台进行交易。
在近期的一次交流中,北方大数据交易中心(天津)有限公司总经理李基亮向36氪介绍,这个模式可以将北方大数据交易中心理解为生态中的“中间人”角色,它既能够了解数据需求方的实际需求,并提供相关咨询服务,还能带着具体需求帮助客户进行“数据寻源”,锁定生态中真正有能力提供相关数据价值的“卖方”,接下来交易中心会通过隐私计算与大模型技术的加持,生成“知识数据产品”,并让知识数据产品的交易动作自然停留在该平台上进行。
整个过程,将最终形成一条“数据资产化-数据知识化-知识服务化-数据货币化-业务智能化”的完整数实融合交易链。
图注:北方大数据交易中心的“数实融合交易链”
从中不难看出,北方大数据交易中心在连接供需双方中,正试图摆脱简单的“撮合者”角色,通过引入数据交易前期的免费咨询服务、数据交易中期的数据寻源服务以及数据交易中后期的数据知识产品“加工”服务,向供需双方强调:“买方和卖方都离不开我”的理念。
在李基亮的设想中,一旦买家离开“北数”也许并不能真正了解自己的需求,以及就算知道需求也未必能精准寻找到有优质数据的卖家;一旦卖家离开“北数”则有可能没有办法将自己的数据“产品化”,更无法确保自己的一份数据可以通过生成不同客户需求的产品,持续产生收益。
这样看来,北方大数据交易中心的“市场化”思路已初步形成,但就目前行业状况,落地或许也是场长期攻坚战。
其中,“垂直领域生态圈”能否成功搭建是决定成败的关键。具体而言,垂直领域生态圈中的数据质量、数据产品授权、数据产品效果等细节均是重要影响因素。
而在数据质量方面,垂直领域生态圈中数据大户非头部企业莫属,现阶段虽然有“数据入表”的政策鼓舞,但大部分头部企业的数据治理工程还在提升的路上。
在数据产品的授权方面,龙头企业是否同意由“北数”进行产品化升级,不仅考验着“北数”的资源拓展与合作能力,更对北数的安全技术、产品附加值等方面提出更高要求。
在数据产品的效果方面,由于北数刚刚成立,具体的知识化产品效果如何仍有待时间验证。
一批又一批数据交易所的市场化探索,正呈现出业务逐步“做重”的趋势。比如,参与方似乎都在探索利用技术解决数据交易的安全性问题;再加上通过对大数据的“再加工”,如形成数据报告、知识数据产品等,提高数据产品的附加值;通过引入更丰富的行业生态角色,拓展数据的价值空间。
但数据治理动力不足、交易中心附加值验证难度高、数据产品效果不确定等问题,仍需要时间给出答案。