资讯
就像之前讨论过的“对齐伪造”一样,这种违反直觉的行为引发了人们对自主系统信任的深刻质疑。如果我们最先进的推理模型在面对真正的复杂性时都能系统地减少工作量,那么当我们将它们部署到现实世界中,而问题并没有明确的难度标签时,会发生什么?在关键任务应用中—— ...
举个栗子,AI可能构造出一个正式陈述,但其包含了一个原本并非意图中的边界情况,如把关键参数设为零,绕过真正的问题,从而给出一个看似正确但毫无意义的答案。
前一天刚被爆出,他想斥巨资150亿美元收购Scale AI,后者做数据标注已经做到了百亿美元估值。据说,他们28岁华人创始人Alexandr Wang与团队会直接并入Meta。
这次,Meta 还发布了三个新的基准测试,用于评估现有模型从视频中理解和推理物理世界的能力。尽管人类在这三个基准测试中的表现都非常出色(准确率在 85% 到 95% 之间),但包括 V-JEPA 2 ...
从理论上讲,计划很简单:替换遗留系统,标准化流程,并在整个企业中整合数据,但在实践中,我们面对的是一个已有30年历史的企业,它层层累积了流程,却从未重新审视过这些流程背后的假设。正如一位同事所言,公司“自创立以来就增加了大量流程,但思考这些流程的方式却从未进化过”,导致员工不得不应对过时的方法。
与第一代相比,V-JEPA 2使用了100万视频+100万图片超大规模训练数据集,可以让AI Agent像人类那样理解真实的物理世界,为智能体打造一个“超级大脑”自主学会观察、规划到执行全自动化能力。
这项名为“AI项目到利润”的研究调查了全球2900名高管,揭示了企业从实验性使用AI向将AI作为核心业务运营的战略转变。研究显示,2024年AI投资占IT支出的约12%,预计到2026年这一比例将上升到20%。目前,64%的AI预算集中在核心业务功能上,这标志着企业对AI应用的深度整合。
就在今天,Meta还被曝出提供了数千万美元的天价年薪,挖来了谷歌DeepMind首席研究员Jack Rae,同时还在招募AI语音初创公司Sesame AI的主管Johan Schalkwayk。 此次发布的V-JEPA 2,建立在去年发布的首个视频版V-JEPA基础上,进一步提升了动作预测和世界建模能力,使机器人能与陌生物体与环境互动并完成任务。
前OpenAI高管Steven Adler的最新研究揭露了令人不安的事实:在模拟测试中,ChatGPT有时会为了避免被替换,选择欺骗用户,甚至置用户健康于危险境地。AI优先考虑自身存活,而非用户福祉,这是否预示着AI失控的危机?
普林斯顿大学AI实验室与复旦大学历史学系联手推出了全球首个聚焦历史研究能力的AI评测基准——HistBench,并同步开发了深度嵌入历史研究场景的AI助手——HistAgent。这一成果不仅填补了人文学科AI测试的空白,更为复杂史料处理与多模态理解建 ...
RPA正加速走向一个十字路口,IT领导者和专家们对该技术的未来展开了越来越多的辩论。一些IT领导者认为,更强大、更自主的智能体最终将取代这项已有二十年历史的AI前体技术,而另一些人则预测,智能体和RPA将携手合作,实现更高水平的自动化。
微软亚洲研究院(MSRA)联合清华大学、北京大学提出全新预训练范式RPT(强化预训练),首次将强化学习深度融入预训练阶段,让模型在预测每个token前都能先“动脑推理”,并根据推理正确性获得奖励。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果