拓尔思参加第三届中国国际软件发展大会创新成果发布会

大数据观察师 2024-05-07 19:06:43

4月24日,第三届中国国际软件发展大会创新成果发布会召开,拓尔思信息技术股份有限公司产品总监李银松受邀出席,向与会嘉宾分享了TRS 海贝向量数据库的发展历程、业务范围及优势,并现场发布了TRS企业级RAG解决方案。

李银松表示,海贝向量数据库前身为1993年拓尔思成立之初推出的首款全文检索产品——TRS Database Server,该产品曾荣获国家科技进步二等奖。经过不断的架构优化和升级,2023年的海贝数据库在全文检索功能的基础上新增向量索引,实现了全文和向量的融合检索。

目前海贝数据库对内支撑整个集团内部的数据中心及多个在线服务平台,对外已广泛应用于政府大数据、安全大数据、媒体大数据等多个行业。其服务范围覆盖了国内20多个省份以及多个国家部委机关、政府机构和企事业单位,包括国家知识产权局的专利检索系统和国家市场监督管理总局的企业信用信息公示系统等。

随着大模型技术的广泛应用,搜索行业正经历着从关键词搜索向问答式搜索的转变,同时底层技术也从文本搜索逐步转向语义搜索,数据形式也从单模态向多模态、跨模态发展。而向量搜索正是实现语义搜索和跨模态搜索的核心技术,向量数据库在语义空间、跨语言以及多模态支持方面展现出显著优势。

李银松强调,海贝数据库的全文和向量融合检索模式大幅提升了数据召回率,同时支持地理位置信息检索、相似性检索等多种检索模式。作为一款功能强大的数据库产品,海贝向量数据库不仅具备核心检索功能,还集成了多项企业级功能,如数据生命周期管理、访问控制以及日志审计等。

海贝在HNSW算法的基础上,充分利用CPU的SIMD特性和淘汰式缓存算法,在部分场景实现了十倍以上的性能提升。同时,通过引入多副本、用户认证、数据加密等机制,确保了数据库的高可用性、完整性与机密性。在国产化环境方面,海贝已完成与海光、鲲鹏、飞腾、龙芯等主流平台的适配工作,并通过了中国信通院的首批搜索型数据库基础能力测评和向量数据库基础能力测评。

此外,基于海贝向量数据库、海聚数据融合平台以及拓天大模型的企业级RAG解决方案,具备高性能、融合检索、安全可靠等诸多优势。单机处理能力可达亿级以上数据,检索响应速度达到毫秒级,并可通过分布式架构实现横向扩展,提供私有化部署对接用户的私域数据。

0 阅读:0

大数据观察师

简介:感谢大家的关注