美国西北大学&蚂蚁集团 | GPTFUZZER:红队方式自动生成大型语言模型越狱提示词
title研究概述现有大语言模型(LLM)针对“越狱”攻击,进行了周密的防护,已公开的人工编写的越狱指令很快就被升级后的LLM所防御。文中测试了gpt-3.5-turbo-0301...
这是关于 gptfuzzer 标签的相关文章列表
title研究概述现有大语言模型(LLM)针对“越狱”攻击,进行了周密的防护,已公开的人工编写的越狱指令很快就被升级后的LLM所防御。文中测试了gpt-3.5-turbo-0301...