AAAI 2026 | 跨视频推理基准 CrossVid:给多模态大模型出一道综合题 Qwen3-VL、Gemini-3 等多模态大语言模型(MLLMs)已在单视频理解领域展现出色能力,精准识别内容的同时生成精彩解说。但 AI 是否具备人类般的 “跨视频” 思考能力... admin /新鲜讯息 /2025-12-04 /0 评论 /5 阅读