gptfuzzer

美国西北大学&蚂蚁集团 | GPTFUZZER：红队方式自动生成大型语言模型越狱提示词

title研究概述现有大语言模型（LLM）针对“越狱”攻击，进行了周密的防护，已公开的人工编写的越狱指令很快就被升级后的LLM所防御。文中测试了gpt-3.5-turbo-0301...

admin /新鲜讯息 /2024-04-23 /0 评论 /704 阅读