腾讯云向量数据库SDK正式开源

腾讯云向量数据库(Tencent Cloud VectorDB)的 Python SDK 与Java SDK 是基于数据库设计模型,遵循 HTTP 协议,将 API 封装成易于使用的 Python 与 Java 函数或类,为开发者提供了更加友好、更加便捷的数据库使用和管理方式。

项目背景

随着人工智能技术的不断发展和应用,向量数据成为了越来越重要的数据形式。向量数据是指由多个维度数值组成的向量,它可以表示各种类型的数据,如图像、音频、文本等。在人工智能应用中,向量数据通常被用来表示特征,比如图像中的颜色、纹理、形状等特征,文本中的词向量等。为了存储、检索和分析这些向量数据,需要一种专门的数据库,即向量数据库。

腾讯云向量数据库(Tencent Cloud VectorDB)是一款全托管的自研企业级分布式数据库服务,专用于存储、检索、分析多维向量数据,支持多种索引类型和相似度计算方法。该数据库不仅能为大模型提供外部知识库,提高大模型回答的准确性,还可广泛应用于推荐系统、NLP 服务、计算机视觉、智能客服等 AI 领域。

产品能力

  • 高性能 单索引支持10亿级向量数据规模,可支持百万级 QPS 及毫秒级查询延迟。
  • 高可用 提供多副本高可用特性,其多可用区和三节点的架构可用性可达99.99%,显著提高系统的可靠性和容错性,确保数据库在面临节点故障和负载变化等挑战时仍能正常运行。
  • 大规模 支持水平扩展,单实例可支持百万级 QPS,轻松满足 AI 场景下的向量存储与检索需求。
  • 低成本 只需在管理控制台按照指引,简单操作几个步骤,即可快速创建向量数据库实例,全流程平台托管,无需进行任何安装、部署和运维操作,有效减少机器成本、运维成本和人力成本开销。
  • 简单易用 丰富的向量检索能力,支持动态Schema,支持在写入数据时灵活扩展标量字段,无需预先定义所有的字段。多种向量索引算法,包括FLAT、HNSW、IVF系列等主流方法,并具有丰富的相似度计算方法,能够覆盖各类场景的应用需要。用户通过 HTTP  API 接口即可快速操作数据库,开发效率高。同时控制台提供了完善的数据管理和监控能力,操作简单便捷。
  • 稳定可靠 向量数据库源自腾讯集团自研的向量检索引擎 OLAMA,近40个业务线上稳定运行,日均处理的搜索请求高达千亿次,服务连续性、稳定性有保障。

我们致力于为用户提供高效、可靠的数据库服务,并将不断完善和优化产品功能。

开源项目链接:

https://github.com/Tencent/vectordatabase-sdk-python

https://github.com/Tencent/vectordatabase-sdk-java