在AIGC所引发的新一轮AI浪潮中,向量数据库成为资本的宠儿,引发了广泛关注,越来越多的数据库厂商布局向量数据库。
日前,在刚刚结束的第二十五届中国国际软件博览会·中国数据库产业峰会上,南大通用发布了GBase向量数据库GBase Cloud Vector DB,也带来了他们对市场的观察、思考和实践。
为什么需要向量数据库?
为什么需要向量数据库,可以从供需两端分别来看。
首先在需求端,正如南大通用董事长丁明峰所言,随着多元化场景发展,单一数据库不能解决所有问题,每一类应用场景都需要有一种数据库来支持,新兴业务场景催生了向量数据库的出现。
向量数据库可以看作是一种新型的NoSQL数据库,几年前,向量数据库便已出现,目前在机器学习和人工智能领域正变得流行。
向量数据库与传统的关系型数据库以及一些NoSQL数据库都不同,比如PostgreSQL,最初是用来存储行和列的表格数据,MongoDB,它以JSON文档存储数据,Neo4j,以点、边和属性存储图数据,挖掘关联关系。而向量数据库,是专门用来存储和查询向量(Vectors)的数据库。向量数据库做的是模糊匹配,输出的是概率上的最近似答案,比较接近于机器学习中的无监督聚类,这是向量数据库与其他数据库一个最大的不同。