文本、图像、音视频等海量的非结构化数据占数据总量不断上升,预计2025年,将达到八成以上。这些数据由于结构不统一,所以在计算机中通常以向量形式进行特征提取后,再进行存储、计算、应用。为了解决海量数据场景下,向量的存储、计算问题,向量数据库应运而生,其通过数据算法和计算机工程,将向量特征进行分组和索引,以实现高效的相似性搜索。《数据库发展研究报告(2023年)》显示,向量数据库作为12个数据库技术发展趋势之一,其使用场景十分广泛,包括但不限于支撑文本翻译、产品推荐、语义搜索、图像搜索、视频推荐、异常检测、欺诈检测、人脸识别等应用。
向量数据库是一种以向量嵌入方式存储和管理向量数据的数据库,其存储的向量主要来自于对文本、语音、图像、视频等非结构化数据的向量化。在向量数据库中,每个向量都有一个唯一的标识符,并且可以存储在一个连续的向量空间中。与传统数据库相比,向量数据库可以处理更多非结构化数据。
中国信通院云计算与大数据研究所依托中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)和中国信通院数据库应用创新实验室(CAICT DBL),联合中移智家、Zilliz、腾讯云、阿里云、Fabarta、星环科技、华为、九章云极、数翊科技、百度智能云、海康威视、天翼数字生活、联汇科技、抖音集团、科大讯飞、爱可生、中移信息、阿里巴巴、亚信安慧、贝格迈思、拓尔思、南大通用、明瞳数科、墨奇科技、舶云科技、极限科技、人大金仓、上海新炬、浙江智臾、诺司时空、中兴通讯、联通研究院、北银金科、腾讯科技、杭州电子科技大学、山东佰旗、中电金信、之江实验室、浙江联通、电信数智、中信建投、飞腾、中科院计算所、金篆信科、帕科视讯、博云视觉、库瀚科技、甲骨文、沐曦集成电路、金华职业技术学院、中软国际、融信数联、创邻科技、英飞流等超过50家企业专家参与编制,集思广益、群策群力,历时3个月完成5次标准会议讨论,每次会议讨论时长约4小时,共同讨论定稿形成了《向量数据库技术要求》,旨在为供给侧研发和应用侧选型向量数据库提供参考。
向量数据库产品基础能力测试融合了国内行业专家丰富的实践经验与智慧,是对向量数据库基础能力的综合评判,覆盖基本功能、运维管理、安全性、兼容性、扩展性、高可用、工具生态共7大能力域,共计47个测试项目,包括27个必选项和20个可选项。
《向量数据库技术要求》标准框架图
中国信通院“可信数据库”首批向量数据库产品测试正式启动!
中国信通院开展的“可信数据库”系列测试是国内面向数据库产品及周边工具、数据库服务商和应用侧为评价目标的权威测试体系,已见证国内数据库产品由弱变强、服务能力不断完善、生态逐渐丰富的过程,圈定了国内数据库产品和服务商第一梯队,成为厂商产品研发和用户采购选型的风向标。目前,向量数据库测试项目正式启动,欢迎相关单位积极报名参与!
具体测试流程如下:
报名周期:即日起开始报名,2023年10月底截止
测试时间:2023年9月-11月上旬
专家评审会时间:2023年11月中旬
证书颁发:2023年12月数据资产管理大会
联系人:刘老师 13691032906
数据库是基础软件的重要一员,是支撑全球数字经济蓬勃发展的核心技术产品。为推动我国数据库产业国际地位从跟跑、并跑到领跑,2019年10月,中国信息通信研究院云计算与大数据研究所牵头,联合多家数据库企业、应用单位、系统集成商、数据库服务企业、硬件制造商,共同成立公益性免费社群数据库应用创新实验室(以下简称“实验室”),打造了中国数据库产业的“联合舰队”。实验室持续致力于推动我国数据库产业创新发展,以实际问题为导向,以合作共赢为目标,联合政、产、学、研、用等多方力量,协同推进数据库领域应用创新的相关工作。实验室将一直秉承开放理念,持续欢迎数据库领域各企业、各机构、各组织申请加入。
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...