2025年CCF-网易雷火联合基金二期聚焦游戏AI及相关核心领域,共11个课题,资助额度为10-15万元/项,课题即将于2025年11月30日24:00截止申报,欢迎CCF会员积极申报。
CCF-网易雷火联合基金
2025年CCF-网易雷火联合基金聚焦游戏AI及相关核心领域,围绕实际业务场景中的技术痛点,拟支持具有创新性与产业应用价值的研究项目,推动技术从实验室走向产业实践。
二期共发布11项关键技术课题,要求在指定的研究领域主题下,限定课题场景、任务边界和预期指标,与网易雷火及网易伏羲研究团队开展的研究合作,每个项目资助额度为10-15万元人民币。
基金承诺为每个资助项目提供业务场景包括不限于数据、合作培养实习生(每个项目2名)等资源支持。具体项目支持金额及相应服务详情将以项目协议为准。
申报条件
本基金原则上将面向符合如下条件的国内所有高校及科研院所学者展开:
申请者必须是国内高校/科研院所在职的全职教师或研究人员;
申请者必须是CCF会员;优先支持博士毕业10年内的申请者;
申请者具有博士学位或者研究生指导资格。
注:项目申请人在申报前需确认所属高校/科研院所可以作为项目依托单位签署科研合作协议,申请人本人可以作为项目负责人签署项目保密协议等承诺性文件;
所有针对项目申报的问题,请联系基金项目组专用邮箱:[email protected]。
申报方式
申请者点击阅读原文,下载并填写《项目申报表》,每位申请人限提交一份申请;
申报截止时间:2025年11月30日24:00
扫描二维码,提交申请书
本文将就申报中的11项关键技术课题做详细介绍:
【课题名称与定义】1、营销视频剪辑和生成
游戏行业已成为全球数字娱乐产业的重要组成部分。据统计,2024年全球游戏市场规模已超过2000亿美元,竞争日益激烈。在这样的市场环境下,有效的营销推广成为游戏产品成功的关键因素之一。传统的游戏营销主要依赖于静态广告和简单的宣传片,难以充分展现游戏的核心玩法和精彩内容,营销效果有限。
近年来,以抖音、小红书、快手为代表的短视频平台迅速崛起,改变了用户的内容消费习惯。短视频以其生动直观、传播迅速的特点,成为游戏营销的重要阵地。然而,高质量营销视频的制作需要专业的策划、拍摄、剪辑团队,制作周期长、成本高昂,且难以实现大规模批量生产。对于众多中小游戏开发商而言,这种营销方式的门槛过高,限制了其市场推广能力。与此同时,人工智能技术在内容生成领域取得了突破性进展。从文本生成到图像合成,再到视频编辑,AI技术展现出强大的创作能力。特别是大语言模型和多模态AI的发展,使得机器能够理解复杂的多媒体内容,并根据特定需求生成相应的创意作品。这为解决游戏营销视频制作的痛点提供了新的技术路径。
当前游戏营销面临的核心挑战在于如何将丰富的游戏内容素材转化为具有吸引力的营销视频。传统的人工剪辑方式不仅效率低下,还可能因为剪辑师对游戏理解不够深入而错失精彩内容的展示机会。因此,开发一套能够智能理解游戏素材内容、自动生成高质量营销视频的系统具有重要的现实意义和商业价值。通过AI技术实现营销视频的智能化、批量化生产,不仅能够大幅降低制作成本和时间,还能确保视频内容的一致性和专业性,帮助游戏产品在竞争激烈的市场中获得更好的曝光和用户关注。该课题以游戏相关图文、视频素材为基础,通过算法自动理解素材,经剪辑和生成生产营销向视频,实现对游戏素材的正面评价。
关键指标
1)在测试集数据上和基于简单规则的baseline方法的生成结果作双盲众包评测对比新算法结果更优的比例大于80%
2)30s视频的生成时间在10分钟之内
【课题名称与定义】2、美术作品多维度评估
在游戏UGC、美宣、影视制作等核心场景中,个人美术创作者作为关键创作主体,已形成风格鲜明、价值导向清晰的新质生产力量。
然而,当前行业对该群体能力的评估仍存在主观化与非标化问题,显著制约了优质创作人才的精准识别与高效配置。
学术界虽已构建面向美术院校教育的审美评价模型,但针对具体行业的专业化美学评价体系仍处于探索阶段,兼具学术严谨性与行业实用性的领域审美评估模型尚未形成,相关研究存在明显空白,难以满足产业对相关人才评估的迫切需求。
本课题拟通过对个人美术创作者作品的多维度量化评估,构建一套客观可落地的行业专属美学评估模型;
研究成果有两方面具体价值:
对于产业界价值:
1.能为游戏厂商高效准确链接美术人才,提高创意水平;
2.基于评价模型的CoT反馈,辅助美术接口人评估日常作品,同时为创作者提供客观且具建设性的作品评估服务,助力创作水平持续提升。
针对创作者价值:
1)针对作品对在多个审美维度上进行量化评估;
2)基于评估结果,形成具有实践指导意义的优化方向建议。
关键指标
1)准确性:在各指标维度测试集数据上和专家双盲评测对比,能力评估级别一致性>70%。
2)覆盖度:覆盖原画环节中的角色原画、场景原画评估,能够支持上述环节中80%以上原画作品的评估。
3)评估效率:单卡每天评估10000件美术作品。
【课题名称与定义】3、高表现力表情合成方案
技术应用基础:伏羲自研表情合成系统已落地剧情动画、剧组模式,氛围NPC,剧情动画等场景中,成为PGC/UGC表情动画生成的基础。
当前核心痛点:现有小模型依赖少量专业数据,在表情丰富度、表现力上不足,与视频迁移技术效果差距明显;尤其在高端项目镜头特写场景中,无法满足玩家对表情细节的高感知需求,制约角色交互体验与沉浸感上限。
技术转型机遇:参考大语言模型(小→大)、语音/视频合成(规则→数据)的演进路径,表情合成技术需向“基于大规模视频数据的大模型”转型,以突破传统小模型局限
项目迫切需求:重点项目需更细腻的微表情、更自然的情感过渡、更丰富的表情层次,亟需大模型提供更强的表情理解与生成能力,同时通过多模态全链路映射(文本-音频-视频表情-面部动画参数),革新手工制作模式,提升表情内容生产效率与个性化水平。
本课题聚焦游戏角色表情合成技术升级,针对伏羲现有小模型方案在表情丰富度、表现力上的不足(尤其高端项目镜头特写场景),以构建基于大规模视频数据的表情生成大模型为核心目标。通过自动化采集影视剧、访谈等多源数据,构建至少含50万条视频的多模态异构数据集,采用层次化标注策略保障数据质量;依托RVQ-VAE等类似技术实现表情特征分层离散化,结合Transformer架构搭建多模态条件token预测框架,实现文本、音频等输入到表情动画的端到端生成。
关键指标
1)构建包含至少50万条高质量的表情视频数据的大规模训练集
2)相比行业内最先进方案,综合表现力对比测试胜率超过70%
3)发表一篇表情生成大模型相关论文以及完成一篇相关专利
【课题名称与定义】4、动作迁移
技术应用基础:伏羲自研动作迁移系统已落地剧情动画、剧组模式,原型验证等场景中,成为PGC/UGC肢体动画迁移的基础能力。目前线上相关服务的每天调用量大概在2万次左右。
当前核心痛点:现有方案依然存在部分动作细节丢失(“节奏和力量感偏弱”、“手部精细动作失真”),细致的肢体交互还原有限,脚步和根节点不够自然(滑步)等问题;这些动作细节降低了动作迁移的降低上限,限制了UGC玩家的输入和在PGC领域的应用范围。
技术转型机遇:社区逐渐开源了一系列人体为中心大规模数据训练的视觉模型,配合Unreal合成数据集+人工矫正的方案,有望实现动作迁移方案的一个质的提升。
项目迫切需求:UGC场景需更自然、更还原的动作迁移表现;外部竞品类似玩法相关表现提升很快,需要保持雷火游戏在这块的竞争优势。
本课题针对伏羲现有方案“滑步”“手部失真”等缺陷及竞品差异化竞争,同时满足二次元用户个性化需求,旨在突破技术瓶颈,推动技术从UGC功能延伸至专业动作生产,降低游戏制作成本。课题研究以Top-Down模式为基础,重点提升2D关键点识别、3DLifting、动作重定向三大模块:通过UnrealMetahuman+Style3D构建合成数据集、微调预训练模型优化2D关键点识别;扩增动捕数据、改进Diffusion模型提升3DLifting稳定性与补全能力;借助穿模损失、IK优化减少重定向后穿模与滑步,助力课题技术升级目标实现。
关键指标
1)对比当前伏羲版本和竞品方案,综合表现力对比胜率超过70%
2)完成一篇相关专利
【课题名称与定义】5、人设对话
人设对话是游戏智能NPC的核心交互基石,其核心价值在于构建“有温度、有人设一致性”的虚拟交互场景,远超基础问答功能。它需支撑RPG中NPC依据玩家剧情选择延续情感对话、开放世界日常互动适配,实现跨场景通用性;更要赋能UGC创作,让模型快速适配玩家自定义人设,助力玩家从“剧情参与者”升级为“NPC人设创作者”。
当前传统对话系统在人设连贯性、场景适配性等方面存在局限,而本课题拟针对性研发:一是构建数据与模型层面可共享的可配置人设对话能力,支撑各项目定制开发;二是聚焦古风、二次元等重点风格场景,研发专属对话能力,以优化用户体验。
针对人设对话场景,本课题围绕以下方面进行研究:
1)对话评测:课题将制定标准的对话评测方案、开展自动化评测方案的研究;
2)数据集构建:课题探索人设设定数据、对话数据、用户模拟器、偏好数据的构建方式;
3)模型训练:课题探索不同基座模型的SFT,同时探索RL对效果的提升,以此完善游戏智能NPC人设对话能力。
关键指标
1.技术成果
1)产出标准化评测方案和评测数据集。
2)人设对话数据产出不少于2万组。
3)发表2篇A类人设对话论文和2篇专利。
4)自研人设对话模型与业内最优模型多轮对比盲测胜率达到50%。
2.业务价值
1)应用于不少于3个项目场景。
【课题名称与定义】6、游戏场景语音合成与语音转换技术
目前游戏中的角色配音依赖专业声优,成本高且周期长,需AI实现“导演级”声音控制,从PGC走向AIGC,节约录音的成本,并应用到剧情之外的各个场景中,提升玩家沉浸式的体验。但现有的语音大模型,包括外部商用的豆包/minimax等模型,整体可控度、效果表现力很难达到录音的水平。
技术上具体拆分为2个子课题:
1.细颗粒度可控TTS技术,实现包括富语言/情感风格tag/人设/背语境/风格等描述性指令的控制,各方面逼近真人录音的效果;
2.风格高度还原的高表现力VC技术,通过真人录音的方式,提供专业级情感/风格等表现力,然后通过VC进行音色转换,但表现力可以极大地保留,提升合成语音的上限;
针对上述需求,本课题围绕两个子课题展开研究:
子课题1:聚焦细颗粒度高可控TTS技术,课题将通过TTS大模型实现情感、场景、富语言、风格等的细颗粒度高可控,同时提升极端情绪、应激等场景的表现力上限,并构造丰富的风格RAG库;
子课题2:专注风格高度还原的高表现力VC技术,课题将重点提升语音转换在情感、风格、富语言等方面的表现力还原度,同时兼顾模型的发音稳定性和音质,以达成“导演级”AI语音控制目标。
关键指标
子课题1:细颗粒度高可控TTS技术
1)效果上,能够实现高度可控性,真人混淆度达到80%,主观moa分达到4.2分,对比线上/竞品方案胜率70%
2)数据上,构造2000条以上的语音风格RAG库;
3)发表1篇语音TTS大模型论文或者完成2篇相关专利
子课题2:风格高度还原的高表现力VC技术
1)效果上,能够风格的高度还原,还原度达到80%,主观moa分达到4.2分,对比线上/竞品方案胜率70%;
2)发表1篇论文和1篇相关专利
【课题名称与定义】7、基于VLM评估的游戏竞技机器人生产管线
游戏竞技机器人(即AI-Bot)是PvP玩法或游戏中的关键组成部分,因其应用场景对交互真实性具有较高要求,其“拟人性”水平直接影响玩家的核心体验。
在传统开发流程中,“拟人性”优化通常依赖人工设定的一系列规则或奖赏函数,整个过程需大量人工参与,效率较低。近年来,大语言模型的发展使得机器能够在一定程度上模拟人类的思维方式。同时,考虑到视频游戏中玩家对人机角色的区分主要依赖于视觉信息,我们提出利用大模型强大的视觉理解能力,替代人类进行“拟人性”的评估与优化。
针对游戏PvP场景,本课题基于模仿学习/强化学习等方法生产控制NPC(非玩家角色)的策略;课题会记录该策略的第一方或第三方视角视频片段,经由VLM产出特定指标/需求的分析及评分,再通过这些反馈影响前述的NPC策略生产过程,以此实现AI-Bot“拟人性”的高效优化,提升玩家PvP交互体验。
关键指标
1.VLM理解特定游戏能力:
1)结构化评分:测试集(如抽检50局)上,VLM评分与人类(众包/专家)评分的皮尔逊相关系数>0.8或二值评分一致率>80%
2)可解释文本的事实正确性:评估给出的文本片段的事实正确性,使用人类抽检形式或LLM对比语义相似度(已有人类标准答案的测试集,语义相似度小于80%算错误),错误率≤20%(错误率定义为:错误原子句÷总原子句)
2.生产管线效率及效果:
1)效率:人力成本降低30%,假定类似PvP项目投入M人月,使用该管线后,产出相同效果机器人投入0.7M人月
2)效果:绝对拟人分:拟人性得分>85分相对拟人分:对比传统流程生产的模型,拟人性方面对比胜率>85%
【课题名称与定义】8、导演AI-对局剧本生成方案研究
近年来,游戏机器人剧本在产业界兴起,尤其竞技类游戏中,AIBot为核心的剧本演绎可提升玩家对战体验。但现有技术存短板:剧本依赖人工定制,真实性不足;多为片段演绎,缺乏整局尺度呈现;未考虑玩家个性化投放;无总体规划与实时调控,难协调多机器人与玩家交互。
本课题拟研究从玩家数据提炼对局过程表征的方法,实现全局机器人剧本生成、演绎、调控及个性化投放,以提升玩家体验、游戏活跃度与留存。
给定游戏玩家对局数据,本课题围绕以下方向展开研究:
1)课题研究剧本表征构建和玩家对局形态提取方法;
2)课题探索基于表征的剧本生成和个性化投放方法;
3)课题研究剧本时间线组织算法,基于剧本类型和维度,产出时间线维度上的全局剧本;
4)课题研发基于游戏机器人(AIBot)的剧本行为演绎算法,以此完善游戏机器人剧本体系,满足竞技类游戏对局需求。
关键指标
1)基于对局数据研究热度对局的筛选方法,产出50万场的热度对局
2)基于热度对局的结算数据和录像数据,通过归纳、聚类、大模型分析等一系列方法,产出剧本类型和维度划分,新增100个剧本类型
3)剧本演绎:实现指令可控剧本演绎Agent,指定剧本的主观评测演绎可信度达90%以上
【课题名称与定义】9、发型服装匹配和染色
游戏角色的智能创建功能,特别是允许玩家个性化定制虚拟形象的系统,多年来一直是广受玩家欢迎的重要特性。通过个性化定制自己所控制的虚拟形象,玩家能够在游戏的沉浸感和互动感方面获得显著提升的体验。这种定制化不仅满足了玩家表达个性的需求,更重要的是增强了玩家与游戏世界的情感连接,从而提高游戏的长期留存率和商业价值。现代玩家对于角色外观的追求已经远超基础的功能需求,他们期望能够创造出独特且美观的虚拟形象,这推动了游戏角色智能创建技术的持续发展。
在这一领域,网易伏羲实验室作为业界领先的AI技术团队,在智能捏脸技术方面持续探索多年,已经发表了多篇高质量学术论文,并形成了相对成熟和完善的面部智能创建技术方案。这些研究成果不仅在学术界获得了广泛认可,更在实际的游戏产品中得到了成功应用,为玩家提供了便捷高效的面部定制体验。
然而,相比之下,游戏角色的发型和服装的参数化智能生成仍然是学术界和工业界尚未完全解决的技术难题。当前的发型服装定制系统主要依赖于预设模板的简单组合,缺乏真正意义上的智能化生成能力,无法满足玩家对于更加个性化和创意化外观的需求。这一技术瓶颈严重限制了角色定制系统的发展潜力。
基于上述背景,本课题致力于研究基于图像、文字等多模态输入的游戏角色发型服装参数化智能生成技术。具体而言,我们希望开发一套能够在游戏内预置的发型服装系统中自动生成对应参数的智能算法,包括发型服装的款式参数和染色参数的精确控制,最终实现既符合用户语义描述又具备视觉美观性的发型服装智能生成效果。这一研究不仅具有重要的理论价值,更将为游戏行业的角色定制技术发展提供关键的技术突破。
给定图像、文字等多模态输入,本课题将在游戏内预置的参数化发型系统和服装系统中,生成对应发型服装款式和染色参数,通过课题对参数生成逻辑的优化与调控,最终生成语义一致且美观的3D角色发型服装,突破当前角色定制技术瓶颈,完善游戏角色智能创建体系。
关键指标
1)语义一致性对比《逆水寒》手游线上版本主观评测胜率大于70%
2)美观度对比《逆水寒》手游线上版本主观评测胜率大于70%
3)发表一篇A类论文
【课题名称与定义】10、自动蒙皮
在当前的游戏开发流程中,从角色建模到最终的动画呈现,蒙皮技术扮演着承上启下的关键作用,直接影响着角色动作的自然度和视觉表现力。
传统的角色蒙皮工作流程高度依赖专业的技术美术人员手工完成。技术美术师需要根据角色的解剖结构和预期的动画需求,精确设置每个顶点对应骨骼的权重分配,确保角色在各种动作姿态下都能呈现出自然的变形效果。这一过程不仅技术门槛高,需要丰富的人体解剖学知识和多年的实践经验,而且极其耗时耗力。对于一个复杂的游戏角色,完整的蒙皮工作往往需要数天甚至数周的时间,随着游戏内容的丰富化和个性化需求的增长,现代游戏往往需要大量的角色模型。从主角到NPC,从装备变化到角色定制,每一个新的角色变体都需要重新进行蒙皮处理,严重制约了游戏开发的整体效率。
近年来,深度学习和人工智能技术在计算机图形学领域取得了显著突破,为解决自动蒙皮这一长期技术难题提供了新的思路。基于神经网络的几何处理方法在3D模型分析、变形预测等方面展现出强大的能力,使得机器能够学习和模拟人类专家的蒙皮经验。图神经网络、变分自编码器等前沿技术的发展,为实现高质量的自动蒙皮算法奠定了坚实的理论基础。
开发智能化的自动蒙皮技术具有重要的实用价值和广阔的应用前景。该技术不仅能够大幅提升游戏开发效率,降低对专业人员的依赖,还能确保蒙皮质量的一致性和标准化。对于追求快速迭代和大规模内容生产的现代游戏开发而言,自动蒙皮技术的成熟应用将带来显著的生产力提升,推动整个游戏行业向更加智能化和自动化的方向发展。本课题聚焦基于深度学习的自动蒙皮算法研究,课题以未蒙皮的人物模型与单个游戏项目统一的全量骨骼作为输入,通过课题构建的算法模型进行处理,最终输出人物模型每个顶点相对于每个骨骼的蒙皮权重,以此实现自动蒙皮功能,解决传统蒙皮流程痛点,助力游戏开发效率提升。
关键指标
1)蒙皮顶点权重精确率>85%,召回率>98%
2)发表一篇A类论文
【课题名称与定义】11、基于LLM的行为预测归因和个性化干预
随着全球游戏市场进入存量竞争时代,用户增长红利见顶,玩家留存与生命周期价值(LTV)最大化已成为游戏公司的核心关切。在此背景下,对玩家流失风险的精准预测、归因分析以及随之而来的高效、个性化干预,是提升运营效率、巩固产品竞争力的关键。然而,当前行业普遍依赖的传统方法面临多重瓶颈:人工特征工程开发时间长、专家分析人工成本高且效率低、高精度预测模型黑盒难解释、干预设计难度大等。
玩家在游戏内产生的行为日志(如“击败BossA”、“购买道具B”、“完成日常任务C”)本质上是一种富含语义信息的“自然语言”序列。大型语言模型(LLM)在理解上下文、建模序列依赖关系和挖掘潜在语义方面展现出巨大潜力。本项目旨在探索利用LLM构建端到端的智能体框架,直接将玩家的自然语言行为序列作为输入,自动完成流失预测、原因归因并生成个性化干预决策。这不仅有望解决上述行业痛点,实现降本增效,更是将LLM应用于复杂决策科学领域的一次前沿探索,对推动游戏人工智能从“感知智能”迈向“认知智能与决策智能”具有重要的研究意义和商业价值。
课题结合玩家行为的语义日志序列,构建基于LLM的玩家分析及干预智能体原型系统,并完成以下具体任务:
1)高精度预测:课题将输入玩家近期行为序列,实现针对玩家短时、T+1、T+n等时长下的精准行为预测;
2)可解释归因:对于预测(或观察到)的玩家流失等行为,课题提供可理解的自然语言归因分析,并输出支撑预测归因的关键行为片段;
3)有效干预:课题基于模型预测归因结果,生成个性化干预策略建议,同时辅助搭建基于Agent模块或Tool管线的A/B干预分析链路。
关键指标
1.技术指标如下:
1)高精度预测:纯行为序列输出条件下,T+1行为预测准确率达到90%以上;
2)可解释归因:对于预测/观察到的流失现象,可解释归因结果与游戏专家判断的一致性达到90%(包括归因维度、以及归因排序等)
3)有效干预:基于同一个行为序列大模型方案输出的个性化干预方案,在A/B测试中,使得目标群体的7日留存率(LT7)相对提升5%以上,效果与游戏专家的干预方案相当。
2.性能指标如下:
1)大模型参数体量控制在14B以内
2)预测归因的线上推理服务延迟控制在20s以内
3.发表1-2篇A类论文。
点击“阅读原文”,查看详情。
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……




还没有评论,来说两句吧...