文本、图像、音视频等海量的非结构化数据占数据总量不断上升,预计2025年,将达到八成以上。这些数据由于结构不统一,所以在计算机中通常以向量形式进行特征提取后,再进行存储、计算、应用。为了解决海量数据场景下,向量的存储、计算问题,向量数据库应运而生,其通过数据算法和计算机工程,将向量特征进行分组和索引,以实现高效的相似性搜索。《数据库发展研究报告(2023年)》显示,向量数据库作为12个数据库技术发展趋势之一,其使用场景十分广泛,包括但不限于支撑文本翻译、产品推荐、语义搜索、图像搜索、视频推荐、异常检测、欺诈检测、人脸识别等应用。
近日,在中国信通院“可信数据库”向量数据库产品测试中,北京奇虎科技有限公司(简称:360)MatrixBase向量数据库系统顺利完成向量数据库产品基础能力测试。测试过程依据标准在基本功能、运维管理、安全性、兼容性、扩展性、高可用以及工具生态七大能力域的相关要求。测试结果表明,该产品在向量数据库的功能完备性、易用性、通用性等方面均符合标准要求。
《向量数据库技术要求》是中国信通院云计算与大数据研究所依托中国通信标准化协会大数据与区块链工作组(CCSA TC1 WG6)以及大数据技术标准推进委员会(CCSA TC601),联合超过50家企业专家参与编制的技术标准。其包含基本功能、运维管理、安全性、兼容性、扩展性、高可用以及工具生态七大能力域共47个测试项,其中分为27个必选项和20个可选项。作为业内首个向量数据库技术标准,可为向量数据库的研发、测试以及选型提供参考。
MatrixBase向量数据库系统产品简介
360 MatrixBase向量数据库V1.0是360拥有完全自主知识产权的国产软件,高性能、可扩展,使用场景广泛、支持各类国产硬件环境。不仅支持传统的文本检索、同义词、敏感词等功能外,还支持图像、视频、音频的高质量搜索,配合大模型还可以实现检索增强生成(RAG)等功能,在政府、军队等客户中得到了广泛应用。
1、融合检索
360 MatrixBase向量数据库系统使用360自研全文检索引擎和向量检索引擎融合的方式提供检索服务,大大提高了搜索结果的准确性和性能。依托360搜索的大量积累,更好的满足用户的检索需求
2、高性能
360 MatrixBase向量数据库系统支持数据分布式、检索分布式、索引分片、向量压缩等技术,大大提高了检索性能。另外,还支持GPU/NPU等多种部署方式,能够大幅提升检索性能。
3、高安全性
360 MatrixBase向量数据库系统支持数据、索引、服务、权限等全系列安全保证,依托360安全技术,达到业内顶尖的安全水平。
4、广泛兼容性
360 MatrixBase向量数据库系统不仅兼容传统的x86硬件,还广泛支持国产各类x86/arm硬件平台。不仅支持英伟达系列GPU,还广泛支持国产昇腾NPU等加速卡。
依托360在搜索、数据、安全方面的技术,360打造了完整的检索增强生成解决方案(RAG),为用于提供更准确、多样等能力,大大提高了用户的使用体验。整体流程分为四大模块:数据准备、数据存储、检索召回、模型总结,流程图如下:
目前,第二批向量数据库基础能力测试项目开启报名,欢迎相关单位报名参与!
报名周期:即日起开始报名,2024年5月15日截止
测试时间:2024年4月-6月上旬
专家评审会时间:2024年6月中旬
证书颁发:2024年7月16、17日可信数据库发展大会
联系人:刘老师 13691032906
一图读懂2024上半年可信数据库测试体系
数据库是基础软件的重要一员,是支撑全球数字经济蓬勃发展的核心技术产品。为推动我国数据库产业国际地位从跟跑、并跑到领跑,多家数据库企业、应用单位、系统集成商、数据库服务企业、硬件制造商,共同成立公益性免费社群数据库应用创新实验室(以下简称“实验室”),打造了中国数据库产业的“联合舰队”。实验室持续致力于推动我国数据库产业创新发展,以实际问题为导向,以合作共赢为目标,联合政、产、学、研、用等多方力量,协同推进数据库领域应用创新的相关工作。实验室将一直秉承开放理念,持续欢迎数据库领域各企业、各机构、各组织申请加入。
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...