图片来源@视觉中国
随着各大企业陆续进入数字化转型的快车道,关系数据越来越多,擅长处理关系数据的图数据库也越来越受到市场关注。原因在于,传统的关系型数据库是以寻着表格信息计算掉每个数据之后得出结论,而图数据库深度关联数据之间的关系,让分析者能更多维度地观察和分析数据,让数据分析效率更高,洞察更深层的数据价值。
Neo4j CEO Emil Eifrem近日就图数据库的发展趋势问题,发表了署名文章。他表示,随着信息世界的快速发展,数据库平台如雨后春笋般出现,市场上可选择的数据库增加到了350多家。且这个市场还在以5%-6%的速度高速扩张,市场体量未来4到5年有望从现在的500 亿美元攀升至 1,000 亿美元。
在这个过程中,数据库行业发展趋势呈现三大特征:融合、向云迁移、数据科学家不断加入。“数据科学家并不喜欢数据库,他们更加钟爱数据。而图数据库是个例外,越来越多的数据科学家对图数据库青睐有加。数据科学家使用图形算法处理数据,再通过图将数据输入机器学习管道中,从而为机器学习模型和预测提供关系型信号。由此,图数据库成为机器学习管道中的核心部分。”Eifrem写道。
所以,面对数据库的未来十年,他的观点是,一直占有绝对优势的传统关系型数据库在过去几十年的发展坚实且具有非凡的价值,是今日数据库技术的基础。而未来十年,将是图数据平台成为主流并大放异彩的十年,这不仅引起了行业专家对图技术的重新思考,对于开发人员而言也是一件幸事。
他也在文章中肯定了中国作为世界上第二大开发者市场,在数据库发展中的关键地位。因此,除了继续投资图数据库和数据科学外,Neo4j还将重点扩展中国市场,帮助越来越多的中国企业通过图数据平台来挖掘数据的价值。
以下为Neo4j首席执行官Emil Eifrem署名文章:
Neo4j CEO Emil Eifrem
萌芽于20世纪60年代的数据库技术在刚刚兴起的十年并没有大行其道。70年代,市场只有很少的选择,且基本算法都基于传统的关系型数据库。而在过去短短的十年,信息世界快速发展,面临极其复杂、互联、动态、不断变化的数据洪流,数据库平台如雨后春笋般涌现,市场上的选择增加到 350 多个。多年来,数据库市场都以每年5%至6%的速度高速扩张,市场体量未来4到5年有望从现在的500 亿美元攀升至 1,000 亿美元。如此惊人的快速发展过程中,所有的创新和实验都是健康且稳定的。
过去两年,数据库行业的发展趋势呈现三大特征:
首先是融合,随着新型数据的大规模创新,高速扩展的数据库市场再次呈现出融合的局面,数百家数据库厂商逐渐归入到包括文档数据库、图数据库、时序数据库、NewSQL数据库在内的四个全新且稳定的数据库阵营中。而融合局势使得在不同细分领域中,仅有有限的几家公司在领军之路上引吭高歌,如图领域的Neo4j 和文档领域的 MongoDB。
第二,向云转移成为整个行业的长期趋势。2017年前后一些大型云供应商和独立云供应商开始涌现。虽然曾因数据重力和监管等因素的影响进展放缓,而今这一趋势再次气势如虹。数据向云服务转移在很大程度上成为数据库平台的发展驱动要素。
第三,数据科学家方兴未艾。整体而言,数据科学家并不喜欢数据库,他们更加钟爱数据。而图数据库是个例外,越来越多的数据科学家对图数据库青睐有加。数据科学家使用图形算法处理数据,再通过图将数据输入机器学习管道中,从而为机器学习模型和预测提供关系型信号。由此,图数据库成为机器学习管道中的核心部分。
一直占有绝对优势的传统关系型数据库在过去几十年的发展坚实且具有非凡的价值,是今日数据库技术的基础。而未来十年,将是图数据平台成为主流并大放异彩的十年,这不仅引起了行业专家对图技术的重新思考,对于开发人员而言也是一件幸事。
图技术为什么如此流行?
归根结底的一个事实是世界的连接正变得越来越紧密,数据相互连接,不断变化和日益复杂且呈爆炸式增长。数据是什么?数据即是对世界的描述,世界连接无处不在,数据也越来越相互关联。以供应链为例,10 年前供应链应用并不是图数据库的最佳用例。因为在当时任何生产实物产品的制造公司可能只拥有一个 2 到 3 个级别的供应链,关系型数据库完全能满足企业的需求。如果需要分析,加入2至3个节点即可。
时至今日,制造业企业不仅业务分布广泛,横跨不同大陆,而且还要应对此起彼伏的突发事件,例如去年肆虐全球的新冠病毒,年初苏伊士运河阻塞导致航运中断一周等情况。制造业企业需要了解这种事件对供应链乃至业务产生的影响,拥有确保供应链安全的能力,行之有效的解决方案就是实现供应链数字化。如今,企业面临的数据分析不再是2至3次的跳转挖掘,而是20、30甚至40次跳转挖掘。数据库尤其是在多次跳转方面表现卓越的图数据库成为必然之选。
不同于关系型数据库,图数据库以事物的连接方式为中心,强调数据之间的关联关系,它将数据间的联系视为和数据本身同等重要。图数据平台让用户能够在图数据库上开发和运行应用程序,它直接将关系和数据在物理层面上一并存储下来,使得访问数据结点和关系的操作能够以线性时间复杂度完成。在普通PC机上的测试结果表明,Neo4j图数据库的查询引擎能够在一秒内轻松遍历百万级的关系/边。
当今的世界是数据的世界,而这个数据时代对开发者而言堪称高光时刻。中国拥有世界上第二大的开发者市场,是一个真正崛起的开发者社区大国。目前,中国大量学生涌入数据库行业的学习中,成为数据库技术的后备军。对于中国的开发者和初学者而言,重视包括数据结构和算法在内的计算机科学知识是数据库学习的基础。良好的开源环境为初学者编写代码提供了高效且低成本的途径,而在云驱动时代,不断地了解并掌握云技术和服务则是学习数据库的必经之路。
开发者驱动是Neo4j的文化,Neo4j的成功离不开对开发者生态的建设。Neo4j重视对开发者的投资并致力为开发者服务,除了定期举办培训、会议等各种活动,还出版大量相应的技术书籍,来辅助开发者不断成长。
中国不仅拥有庞大的开发者社区和创新的技术,还有数量众多的企业在开展数字化转型,数字化企业必须将数据转化为切实可行的商业洞见才能创造价值,而这正是图数据平台的用武之地。自2018年起Neo4j就活跃在中国市场。如今,Neo4j 的业务足迹遍布北京、上海和深圳并与业内合作伙伴建立了良好的关系。今年6月,Neo4j在F轮风险投资中获得3.25亿美元的融资,创造了私营数据库公司单笔最高融资纪录,投后估值超过20亿美元。除了继续投资图数据库和数据科学外,Neo4j还将重点扩展中国市场,帮助越来越多的中国企业通过图数据平台来挖掘数据的价值。