标签:大模型安全

GPT-4o、Claude 3.5全部被攻破,开源大模型超强攻击框架

斯坦福大学、牛津大学等机构联合研发的Best-of-N Jailbreaking(BoN)攻击框架,通过多样化输入提示的变换策略检测多模态大模型的安全漏洞。该技术采用重复采...

UIUC 李博:如何探索大模型背后的安全隐忧?丨ICML 2024 直击

在AI科技评论的访谈中,ICML Tutorial Chair李博教授分享了她对大模型安全问题的看法,并介绍了她创立的Virtue AI公司。李博教授指出,大模型能力的提升并不...

微软发现“万能钥匙”,成功入侵GPT-4o、Claude 3

微软Azure首席技术官Mark Russinovich在其官网上分享了一种新型的大模型入侵技术——“Skeleton Key”(万能钥匙)。这种技术通过多轮强制、诱导策略,使大模型的...

清华大学教授黄民烈:如何把大模型“调教”成我们放心的样子

在讨论大模型安全问题的文章中,作者褚杏娟指出OpenAI安全团队与公司高层之间存在分歧,特别是首席科学家Ilya Sutskever离职后,大模型的安全问题再次成为舆...