研究分享 | 当大模型开始 思考,谁来守护它的安全?ReasoningShield 重磅登场!
你是否曾想过:当大模型在给出最终答案前,那段长长的 "思考过程" 里,可能藏着不为人知的风险?近日,实验室AI大模型安全小组针对这一问题展开研究,不仅揭露了大模型长推理轨迹带来的全...
这是关于 lrms 标签的相关文章列表
你是否曾想过:当大模型在给出最终答案前,那段长长的 "思考过程" 里,可能藏着不为人知的风险?近日,实验室AI大模型安全小组针对这一问题展开研究,不仅揭露了大模型长推理轨迹带来的全...