TuGraph图数据库开源,图计算或将成为未来数据基础?

发表时间: 2022-09-01 20:45

世界“最快”图数据库开源、图计算开源委员会成立……今天下午举行的2022世界人工智能大会“新一代图智能技术发展与实践论坛”上宣布的一系列举措,意味着图计算正从实验室走向应用推广,迎来黄金时代。

作为人工智能领域前沿技术,图计算正悄然成为产业界以及学术界的关注重点。在论坛上,国内科技公司人士从政、产、学、研不同视角共话图计算技术以及应用场景。专家认为,这一新技术有可能会成为下一代的数据底座,助力提升金融、能源、通信等行业的智能化水平,实现科技普惠。

世界“最快”图数据库开源

图计算,简而言之就是将数据按照图的方式建模,以获得用扁平化的视角很难得到的结果,更适合海量数据的数字化时代。目前,包括华为、蚂蚁、AWS等公有云、数据库领域的巨头,都在大步推进图计算的商业化与应用场景探索。最近一段时间,一级市场也掀起了一股图计算的创业与投资热潮,冒出了Ultipa、创邻科技等多家创业企业。

在论坛上,世界“最快”的图数据库TuGraph宣布开源。据悉,TuGraph由蚂蚁集团和清华大学共同研发,是图数据库权威测试世界纪录保持者,也是世界上有测试纪录的“最快”图数据库。开源技术指导委员会也同时成立,以共同建设图数据库应用生态。

蚂蚁集团图数据库负责人洪春涛介绍,这是一套分布式图数据库系统,可以支持万亿级边上的实时查询。此次开源的TuGraph单机版,具备完备的图数据库基础功能和成熟的产品设计,“相较于市场上常见的开源产品,TuGraph单机版的性能高10倍以上。”因此,它可以轻松支持TB 级别数据和百亿级别大图,足以满足大多数业务场景需求。随着TuGraph的开源,开发者可以聚焦应用层,打造属于自己的图数据,从而提升行业整体技术应用水平。

要牢牢抓住“弯道超车”的发展机遇

在业内看来,图计算是未来大数据、人工智能和高性能计算产业发展的关键所在,它很有可能会成为下一代的数据底座。第三方咨询公司Gartner在《2021年十大数据和分析技术趋势》报告中就曾预测,到2025年图计算技术将应用于80%的数据和分析创新。

计算机科学家、中国工程院院士郑纬民认为,随着人类社会步入大数据时代,数据之间的关系变得越来越重要,作为承载数据资源的“容器”并能对外提供查询和分析能力的图数据库也变得愈发重要,在传统数据库时代,国外企业一直占据国内数据库市场的绝对份额,但在图数据库时代,中国有机会与国外企业同期起步,“全球图数据库市场尚未定型,现在布局正当其时,我们要牢牢把握住这一难得的发展机遇。”

由于图计算更加适合海量数据的处理,因此专家普遍认为,金融科技、生物信息、智能制造、电信和公共医疗等对数据实时处理要求更高的行业,将是图计算在商业化应用领域前景最为明朗的应用场景。洪春涛告诉记者,TuGraph已应用于蚂蚁内部150多个场景,包括在线支付的实时链路,以支付宝风险识别能力提升近10倍、风险审理分析效率提升90%的成绩,验证了其高可靠性。他还透露,TuGraph 正在与复旦大学合作,通过与脑科学领域的跨学科合作,将图计算应用于神经元模拟仿真探索。

中国工程院院士、浙江大学信息学部主任陈纯研究的领域也是图计算的一支——时序动态图实时计算及智能决策。在他看来,关联图谱就像社交,以前的关联图谱不带有时间,而基于时序大数据,以前的数据得以留存,现在的数据也时刻流进来,“这就好像水库的水,正在流向水库里的水是流数据,留在水库里的水都带有时间,它对于很多行业分析都极为重要。”陈纯举了一个网络自动化攻击防御的场景案例,基于时序动态图的机器防御系统可通过多服务器访问流水关联决策、长周期数据决策、复杂规则爬虫识别、设备维度爬虫识别等技术,拦截业务系统中占原有访问总流量80%~90%的网络机器人访问流量,使业务系统服务器的压力降为原来的10%。

作者:徐晶卉

编辑:朱伟