国家发明专利丨面向兵棋推演的智能决策方法
近日,渊亭科技自主研发的“面向兵棋推演的智能决策方法、装置及存储介质”荣获国家知识产权局发明专利授权。该发明提出了一种基于“任务—行为”的多智能体强化学习分层训练方法,旨在解决兵棋...
这是关于 强化学习 标签的相关文章列表
近日,渊亭科技自主研发的“面向兵棋推演的智能决策方法、装置及存储介质”荣获国家知识产权局发明专利授权。该发明提出了一种基于“任务—行为”的多智能体强化学习分层训练方法,旨在解决兵棋...
在大规模云数据中心中,虚拟机(VM)调度是保障计算资源高效利用的关键环节。尽管初始调度(VMS)已被广泛研究,但运行一段时间后的虚拟机重调度(VMR)问题却长期被忽视。VMR 指的...
扫码订阅《中国信息安全》邮发代号 2-786征订热线:010-82341063在大模型的训练中,强化学习算法一直是提升模型性能的关键。然而,其面临着计算资源要求高、训练速度慢等问...
我是@卜寒兮,这是我在公众号发布的第【28】篇原创内容,主要唠点【科技| AI |科研】方面的内容,感兴趣的可以点击下方关注。欢迎关注👆前两天就注意到这个工作了,看到“三大会”和不...
首届CCF算法大会暨CCF算法能力大赛(CACC)总决赛及颁奖典礼于2025年4月20日在宁波海曙区委党校盛大启幕。作为大会分论坛之一,由中国计算机学会(CCF)主办、宁波财经学院...
基本信息原文标题:AED: Automatic Discovery of Effective and Diverse Vulnerabilities for Autonomous...
近日,渊亭科技取得《一种基于分布式强化学习的多智能体机器人协同控制方法及系统》国家发明专利。该专利面向机器人控制技术领域,以更加高效、灵活且鲁棒的分布式控制策略来替代集中式控制方法...
大模型技术从基础语言理解向深度思考跃迁。以DeepSeek R1等为代表的推理模型,结合强化学习与思维链(CoT),实现类人类逻辑推理突破。本期ADL专注大模型深度思考与推理技术,...
文末,iLaw团队精心准备《2025年我国制造业数字化转型发展形势展望》《数字孪生网络实践与启示研究报告2024》内容详实充分,如有需要,欢迎扫描下方二维码添加iLaw小助理,发送...
毋庸置疑,三体红岸基地的那束射向太阳的电波,已经被太阳放大后广播给整个宇宙,2022年底ChatGPT3的山姆奥特曼就是叶文洁。AI?事实上大多数人并不知道AI到底能做什么,意味着...