资讯
公正党八打灵再也国会议员李健聪强烈谴责巫统青年团长阿克马日前发表的极不当言论,将批评者比喻为“OKU”(身障者)的言论不仅侮辱了提出合理质疑的民众,也严重伤害了残障群体的尊严。
285名拟赴澳攻读博士学位的中国学生联名向中国驻澳大使馆发起一份请愿,他们称,他们的澳大利亚学生签证长时间未获批,部分等待时间超过300天,其中或存在歧视因素。中国驻澳大使馆与澳移民局皆已回复SBS普通话节目的媒体质询。(点击音频收听详情) ...
【导读】2025年ACL盛会于维也纳落下帷幕!今年会议规模空前,投稿量超过8000篇,其中超半数作者来自中国。4篇最佳论文中,出自中国团队之手的同样占到50%——分别是北大与DeepSeek合作、梁文锋署名的NSA论文,以及北大杨耀东团队揭示模型存在 ...
在 ACL 2025 的颁奖典礼上,由 DeepSeek 梁文锋作为通讯作者、与北京大学等联合发表的论文荣获最佳论文奖。 这次 ACL 2025 规模空前,总投稿量达到 8360 篇,相较于去年的 4407 篇几乎翻倍,竞争异常激烈。 简单来说,他们提出的原生稀疏注意力(NSA)机制,通过算法与硬件的协同优化,直接把长文本处理速度提升了 11 倍。更厉害的是,性能不仅没降反而还超越了传统的全注意力 ...
People take part in a march to commemorate the victims of the Beirut port blast in Beirut, Lebanon, on Aug. 4, 2025.
ACL 2025 ...
The Trump administration is suspending federal research funding to the University of California, Los Angeles (UCLA), one of ...
BEIJING, Aug. 1 (Xinhua) -- With crippling trade tariffs, surging corporate costs and increasing market volatility, the ...
《中东学刊》(The Middle East ...
在通用基准测试中,采用NSA预训练的27B参数模型在9个评测指标中有7个超越了全注意力基线。特别是在推理相关的基准测试上,DROP提升了0.042,GSM8K提升了0.034,显示出稀疏注意力在强制模型聚焦关键信息方面的独特优势。
近日,DeepSeek的下一代技术“原生稀疏注意力”(NSA)在ACL 2025大会上提前曝光,同时由DeepSeek创始人梁文锋作为通讯作者与北京大学等机构联合发表的论文荣获最佳论文奖。这一成果标志着DeepSeek在长文本处理和计算效率方面取得了重大突破。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果