图计算或成为下一代数据底座,世界“最快”图数据库宣布开源

图计算或成为下一代数据底座,世界“最快”图数据库宣布开源
2022-09-02 15:22 南方都市报 编辑:张振山

9月1日,2022世界人工智能大会“新一代图智能技术发展与实践论坛”在上海举行,中国工程院院士、浙江大学教授陈纯在论坛上表示,“图计算技术加上人工智能是未来几年内的一个战略制高点。”论坛上,蚂蚁集团图计算负责人陈文光宣布开源蚂蚁集团高性能图数据库TuGraph单机版,并成立图计算开源技术委员会,中国工程院院士郑纬民、陈纯分别担任主席、副主席,5位业界知名专家担任委员。中国工程院院士、清华大学教授郑纬民也在论坛上表示,“当前图数据库正在成为发达国家科技企业竞相布局的新兴热门领域。在图数据库时代,我们有机会与国外企业同期起步,现在布局正当其时。”

蚂蚁集团开源图数据库TuGraph并成立图计算开源技术委员会

图计算技术区别于关系型数据库,基于图模型,使用点边来表示、存储、处理数据,拥有灵活的数据抽象模型,能够更好地表达出“关系”的概念。据陈纯院士介绍,疫情防控中的时空伴随者研判、网络诈骗分析都可以用图计算技术,将数据分析速度提高到百倍以上。“以前有些需要一天时间分析出来的结果,现在已经可以缩短到几分钟甚至几秒钟。”

在业内看来,图计算是未来大数据、人工智能和高性能计算产业发展的关键所在,它很有可能会成为下一代的数据底座。第三方咨询公司Gartner在《2021年十大数据和分析技术趋势》报告中就曾预测,到2025年图计算技术将应用于80%的数据和分析创新。

南都记者获悉,论坛上宣布开源的TuGraph由蚂蚁集团和清华大学共同研发,是图数据库权威测试世界纪录保持者,也是世界上有测试纪录的“最快”的图数据库。

单机版开源TuGraph功能和模块

蚂蚁TuGraph是一套分布式图数据库系统,可以支持万亿级边上的实时查询。此次开源的TuGraph单机版,同样具备完备的图数据库基础功能和成熟的产品设计,可以轻松支持TB级别数据和百亿级别大图,足以满足大多数业务场景需求。相较于市场上常见的开源产品,TuGraph单机版的性能高10倍以上。

据了解,随着TuGraph的开源,图数据领域将迎来一款性能卓越、功能丰富、生态完备的开源产品。开发者可以聚焦应用层,轻松打造属于自己的图数据,从而提升行业整体技术应用水位。TuGraph开源采用Apache2.0协议,在Github和Gitee上进行托管。

蚂蚁集团2015年开始自主研发分布式图数据库、流式图计算等图相关技术,2016 年发布自研分布式图数据库,并应用于支付宝。 至今TuGraph已应用于蚂蚁内部150多个场景,包括在线支付的实时链路,以支付宝风险识别能力提升近 10倍、风险审理分析效率提升 90%的成绩,验证了其高可靠性。

上个月,LDBC(关联数据基准委员会)发布最新图数据库SNB测试结果,TuGraph在功能完整性、吞吐率、响应速度等层面全球领先。目前,蚂蚁集团已形成了一套以图数据库为底座、同时包含流式图计算,离线图学习的大规模图计算系统。据了解,TuGraph 正在与复旦大学合作,通过与脑科学领域的跨学科合作,将图计算应用于神经元模拟仿真探索。


相关阅读