拓尔思TRS海贝搜索数据库系统完成中国信通院向量数据库产品测试

大数据观察师 2024-04-03 20:54:39

近日,在中国信通院“可信数据库”向量数据库产品测试中,拓尔思TRS海贝搜索数据库系统顺利完成向量数据库产品基础能力测试。测试过程依据标准在基本功能、运维管理、安全性、兼容性、扩展性、高可用以及工具生态七大能力域的相关要求。测试结果表明,该产品在向量数据库的功能完备性、易用性、通用性等方面均符合标准要求。

《向量数据库技术要求》是中国信通院云计算与大数据研究所依托中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)和中国信通院数据库应用创新实验室(CAICT DBL),联合超过50家企业专家参与编制的技术标准,拓尔思为核心参编单位之一。其包含基本功能、运维管理、安全性 、兼容性、扩展性、高可用以及工具生态七大能力域共47个测试项,其中分为27个必选项和20个可选项。作为业内首个向量数据库技术标准,可为向量数据库的研发、测试以及选型提供参考。

TRS海贝搜索数据库系统产品简介

TRS海贝搜索数据库系统V10.0是市场上极少数同时符合搜索数据库标准和向量数据库标准的纯国产自研软件之一。该系统在倒排索引的基础上,引入了高性能的HNSW向量索引,不仅支持常见的文本检索、拼音检索、同义词检索等,还可以搭配大模型(深度学习引擎)实现语义搜索、图片搜索、跨模态搜索以及融合搜索等,可广泛用于企业搜索、检索增强生成(RAG)以及智能问答等应用场景。

功能架构图

TRS海贝搜索数据库功能架构图

优势特点

(1)融合检索

TRS海贝搜索数据库采用全文索引和向量索引融合的方式提供检索服务,融合检索的好处是显而易见的。一方面,这种融合使得搜索结果更加准确和全面。全文检索技术提高了搜索的召回率,而向量检索技术则提高了搜索的精确度,两者相结合能够为用户提供更加全面和准确的搜索结果。另一方面,融合了两种检索技术也提高了搜索的效率。通过全文检索技术,在最初阶段就过滤掉大量无关的数据,从而减小了向量检索的搜索空间,大大提升了整体搜索的效率和性能。

(2)高性能

海贝搜索数据库引入了内存索引、列存储、索引分片等技术,进一步提高了数据存储、检索和分析的效率。自带的分时归档视图,不仅可以实现冷热数据自动分区,同时还支持多种存储混合使用以提供高效的检索服务;通过使用镜像数据库,用户进行简单的配置,就可以实现读写分离、大小库以及访问隔离等;通过对各类型服务器硬件的匹配支持,能够充分发挥出硬件的优良性能。

(3)数据安全

海贝搜索数据库采用多副本机制解决数据的可用性问题,通过数据校验以及WAL技术解决数据的完整性问题,通过完善的权限管理机制、HTTPS、加密存储等机制解决数据访问和数据存储的机密性问题。作为自主可控的国产化加密数据引擎,支持数据与索引的完全加密。在加密算法方面,该系统采用更加安全的国产加密算法,并且可以结合国产加密卡,达到金融级数据安全。

应用场景

依托TRS海贝搜索数据库强大的检索能力,TRS海聚数据融合平台的数据整合能力以及TRS拓天大模型的生成能力,拓尔思打造了一套完整的检索增强生成解决方案。该解决方案充分发挥信息检索和大模型生成的优势,为用户提供更准确、实时和可靠的生成能力,增强用户的信息获取体验。

TRS检索增强生成(RAG)解决方案

市场地位

TRS 海贝搜索数据库已经广泛服务于安全大数据、媒体大数据、政府大数据以及军队大数据等众多细分行业,公安部、新华社、市场监督管理总局、海关总署、专利局、商标局等众多政务客户都选择了该款产品。国家层面几个重大的基础数据库,例如企业信用信息公示系统、专利检索系统等都构建在TRS海贝搜索数据库之上。

0 阅读:1

大数据观察师

简介:感谢大家的关注