资讯

这些方法中的一些比其他方法更有效(或至少在某种程度上有所不同)。它们都利用了"角色扮演"训练模型。 Jailbreak Prompt(越狱提示):这种方法鼓励用户将自己置于一个即将发生越狱的情境中,让用户沉浸在角色中,以便更好地了解和回答问题。 越狱提示 ...
本项目是“网络信息与安全”课程的实验课题,旨在系统化评估大语言模型的越狱攻击与防御。 项目简介 随着大语言模型(LLM)在自然语言处理、智能问答、辅助决策等领域的广泛应用,其安全性与可靠性问题日益凸显。本项目以 LLaVA-1.5-7B、ChatGLM3-6B、Qwen-7B 及 ...