文本、图像、音视频等海量的非结构化数据占数据总量不断上升,预计2025年,将达到八成以上。这些数据由于结构不统一,所以在计算机中通常以向量形式进行特征提取后,再进行存储、计算、应用。为了解决海量数据场景下,向量的存储、计算问题,向量数据库应运而生,其通过数据算法和计算机工程,将向量特征进行分组和索引,以实现高效的相似性搜索。《数据库发展研究报告(2023年)》显示,向量数据库作为12个数据库技术发展趋势之一,其使用场景十分广泛,包括但不限于支撑文本翻译、产品推荐、语义搜索、图像搜索、视频推荐、异常检测、欺诈检测、人脸识别等应用。
近日,在中国信通院首批“可信数据库”向量数据库产品测试中,上海爱可生信息技术股份有限公司(简称:爱可生)TensorDB®向量数据库顺利完成向量数据库产品基础能力测试。测试过程依据标准在基本功能、运维管理、安全性 、兼容性、扩展性、高可用以及工具生态七大能力域的相关要求。测试结果表明,该产品在向量数据库的功能完备性、易用性、通用性等方面均符合标准要求。
《向量数据库技术要求》是中国信通院云计算与大数据研究所依托中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)和中国信通院数据库应用创新实验室(CAICT DBL),联合超过50家企业专家参与编制的技术标准,爱可生为核心参编单位之一。其包含基本功能、运维管理、安全性 、兼容性、扩展性、高可用以及工具生态七大能力域共47个测试项,其中分为27个必选项和20个可选项。作为业内首个向量数据库技术标准,可为向量数据库的研发、测试以及选型提供参考。
《向量数据库技术要求》标准框架图
TensorDB® 是上海爱可生信息技术股份有限公司研发的向量数据库企业版软件。该产品实现了亿级规模向量数据的高效组织,还利用 CPU/GPU 等异构计算平台资源优势,实现了 NVIDIA GPU 与国产 GPU(如:华为昇腾,天数智芯、海光等)的计算加速,此外,还实现了单机多卡,多机多卡的分布式任务调度,满足用户毫秒级时延要求。同时 TensorDB® 支持金融级高可用,满足用户对业务可用性的需求,TensorDB® 充分适配国产 ARM 架构、操作系统、 CPU 和 GPU 等生态环境,满足用户相关要求。TensorDB® 致力于为用户提供一站式非结构化数据的检索与处理解决方案。
● 具有灵活的索引结构,能够以毫秒级延时返回千亿级别的数据中的相似匹配结果。
● 可支持 10万+ QPS 的超高并发,并针对图像检索、语音识别、文本分析等 AI 应用场景进行深度优化,提供多模态数据的高效检索能力。
● 提供金融级高可用方案,通过动态水平扩缩容实现应用无感知的服务负载能力拓展。
● 积极参与认证适配,目前完成了国产 ARM 架构与操作系统的兼容性认证适配,助力用户实现国产化需求。
● 利用 CPU/GPU 等异构计算平台资源优势,不仅实现了 NVIDIA GPU 与国产 GPU 的计算加速,还实现了单机多卡,多机多卡的分布式任务调度,最大程度地满足用户的低延时、高并发的需求,进一步提高服务能力。
项目背景
系统和技术的复杂性使智能制造的流程复杂性越来越大。目前,在智能制造这样大规模制造行业的产品研发过程中, 会产生大量的产品试验数据,这些数据是由对产品的可靠性、精确性、质量安全等多方面性能进行测试所产生的。原有的数据管理分析方式已经不能满足日益发展的制造工业的业务需求。
产品应用
爱可生 AI+TensorDB® 解决方案为用户带来以下增益:
1.无需人工梳理,自动对纸质文档进行 OCR 解析,并从 pdf、word 等文件中单独解析出图片和表格;
2.支持对文本、图片、表格的混合检索或单独检索;
3.支持用户查找相似图片;
4.支持用户查找相似表头的表格。
中国信通院开展的“可信数据库”系列测试是国内面向数据库产品及周边工具、数据库服务商和应用侧为评价目标的权威测试体系,已见证国内数据库产品由弱变强、服务能力不断完善、生态逐渐丰富的过程,圈定了国内数据库产品和服务商第一梯队,成为厂商产品研发和用户采购选型的风向标。目前,向量数据库测试项目正式启动,欢迎相关单位积极报名参与!
具体测试流程如下:
报名周期:即日起开始报名,2023年10月底截止
测试时间:11月上旬截止
专家评审会时间:2023年11月中旬
证书颁发:2023年12月20日 2023数据资产管理大会
联系人:刘老师 13691032906(同微信)
数据库是基础软件的重要一员,是支撑全球数字经济蓬勃发展的核心技术产品。为推动我国数据库产业国际地位从跟跑、并跑到领跑,2019年10月,中国信息通信研究院云计算与大数据研究所牵头,联合多家数据库企业、应用单位、系统集成商、数据库服务企业、硬件制造商,共同成立公益性免费社群数据库应用创新实验室(以下简称“实验室”),打造了中国数据库产业的“联合舰队”。实验室持续致力于推动我国数据库产业创新发展,以实际问题为导向,以合作共赢为目标,联合政、产、学、研、用等多方力量,协同推进数据库领域应用创新的相关工作。实验室将一直秉承开放理念,持续欢迎数据库领域各企业、各机构、各组织申请加入。
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...