大模型安全 | 学习AIGC

揭秘多轮越狱攻击新框架：RACE 如何利用大模型推理能力突破安全防线？

来自北京航空航天大学等机构的研究团队提出RACE多轮越狱攻击框架，通过将有害查询转化为良性推理任务，成功突破多个主流大模型的安全防线。实验结果显示，该...

AIGC动态

2个月前

斯坦福大学、牛津大学等机构联合研发的Best-of-N Jailbreaking（BoN）攻击框架，通过多样化输入提示的变换策略检测多模态大模型的安全漏洞。该技术采用重复采...

AIGC动态

2个月前

在AI科技评论的访谈中，ICML Tutorial Chair李博教授分享了她对大模型安全问题的看法，并介绍了她创立的Virtue AI公司。李博教授指出，大模型能力的提升并不...

AI-Agent

9个月前

微软Azure首席技术官Mark Russinovich在其官网上分享了一种新型的大模型入侵技术——“Skeleton Key”（万能钥匙）。这种技术通过多轮强制、诱导策略，使大模型的...

AIGC动态

9个月前

在讨论大模型安全问题的文章中，作者褚杏娟指出OpenAI安全团队与公司高层之间存在分歧，特别是首席科学家Ilya Sutskever离职后，大模型的安全问题再次成为舆...

AI-Agent

10个月前