vid - 宙飒天下网

AAAI 2026 | 跨视频推理基准 CrossVid：给多模态大模型出一道综合题

Qwen3-VL、Gemini-3 等多模态大语言模型（MLLMs）已在单视频理解领域展现出色能力，精准识别内容的同时生成精彩解说。但 AI 是否具备人类般的 “跨视频” 思考能力...

admin /新鲜讯息 /2025-12-04 /0 评论 /219 阅读