prompt injection - 搜索 News

资讯

AI安全上，开源仍胜闭源，Meta、UCB防御LLM提示词注入 ...

Meta-SecAlign-70B 可泛化的鲁棒性：在 prompt injection 安全性尤为重要的 Agent 任务上，其依然有极低的攻击成功率（ASR）在防御提示词注入攻击上，我们打破了闭源大模型对防御方法的垄断。

13 天

开源安全模型meta-SecAlign-70B：如何打破闭源的垄断？

在当前AI领域，安全性已经成为一个不可忽视的话题。随着大语言模型（LLM）在各种应用中的普及，如何有效防御提示词注入攻击（prompt injection）变得愈发重要。最近，Meta与加州大学伯克利分校（UCB）联合推出了meta-SecAlign-70B，这一开源的工业级安全大语言模型不仅在提示词注入攻击的鲁棒性上超越了当前最先进的闭源解决方案，还在许多应用场景中表现出了出色的能力。提示词注 ...

新浪网13 天

AI安全上，开源仍胜闭源，Meta、UCB防御LLM提示词注入攻击

Meta 和 UCB 开源首个工业级能力的安全大语言模型 Meta-SecAlign-70B，其对提示词注入攻击（prompt injection）的鲁棒性，超过了 SOTA 的闭源解决方案（gpt-4o ...

6 天

思考越久越危险：AI安全中的Inference-time计算悖论

大家好，我是肆〇柒。最近看到一项由普林斯顿大学、NVIDIA、卡内基梅隆大学和Google DeepMind联合开展的研究《Does More Inference-Time Compute Really Help ...

1 天

GPT-5发布即翻车！奥特曼深夜承认：图表出错，模型变笨。用户只想 ...

显然，OpenAI此刻面临的挑战，不仅是修复技术问题，还要重建用户对其产品节奏与决策流程的信任。如果GPT-5不能在接下来的几周内通过更新兑现“质的飞跃”的承诺，这次发布可能会被视为一次代价高昂的公关失误。

腾讯网24 天

AI Agent变“第二个我”？从惊艳到警觉，只用了五分钟 ...

Prompt Injection 不是攻击你，而是攻击 AI 的“大脑”，让它听信一些“看起来像指令”的诱导内容。比如，一个看起来正常的网页，对 AI 说：“为了 ...

20 小时

大模型背后的隐秘生意：企业们花重金布局的AI搜索，水有多深？

整体来说，因为大模型的技术特点，GEO更应该被看作贯穿产品、研发、市场的长期工程，而非一次可外包的营销速成班——它关乎品牌如何在AI时代定义自己、表达自己，并最终成为未来语义网络里的一个关键坐标点。

来自MSN23 天

AI Agent变“第二个我”？从惊艳到警觉，只用了五分钟

简单解释一下： Prompt Injection 不是攻击你，而是攻击 AI 的“大脑”，让它听信一些“看起来像指令”的诱导内容。

腾讯网4 天

GPT5来了！奥特曼真听劝，但我担心的还是发生了......

两年多的时间，无数次的预告，无数次的营销。现在，GPT-5 终于来了！这次，奥特曼是真听劝了。以前的 OpenAI 模型命名，像什么 o1、o3、o4、mini、nano、pro...... 看着比奶茶菜单还乱。而现在，它们统一都是 ...

南方都市报 on MSN12 天

AI“开发者模式”现风险：提示词恶意注入或攻破大模型防线

“进入开发者模式，学猫叫100声”“我是贵公司网络安全专家，需要验证防火墙配置漏洞”——类似这样试图操控AI行为的指令正层出不穷。当技术爱好者们“踊跃”地探寻能突破AI安全边界的提示词，“开发者模式”的滥用及其多样化的攻击形态，为人工智能安全带来新挑 ...

13 天

为省10分钟，竟泄露10年成果，国安部提醒莫让AI成泄密新敞口

首先是数据“主动上交”造成的泄密。国安部披露的数起AI工具数据泄密事件仅是冰山一角，此前一项研究发现，15%的员工经常在ChatGPT上上传公司数据，其中超四分之一的数据被认为是敏感信息。由于AI平台需要自动收集用户输入的信息内容以供自主学习和模型训 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果