首字延迟降低3.6倍,腾讯混元提出Stem稀疏注意力算法,长文推理加速新SOTA
2026-06-05 20:18   
来源: 云财经   
影响力评估指数:16.66  
云财经讯,腾讯混元宣布提出Stem稀疏注意力算法,已被机器学习顶会ICML-26收录。根据Stem算法×HPC算子的全栈加速方案,算法层面,Stem通过Token位置衰减(TPD)和输出感知度量(OAM)实现25%预算下的近无损精度;算子层面,HPC开源的Stem+BSA算子将稀疏收益转化为真实硬件加速,128K上下文下首字延迟降低3.7倍。
云财经智能匹配相关概念
| 新闻标题 | 时间 | 消息来源 | 新闻热度 |
|---|---|---|---|
| 浙商银行不再设置监事会,由董事会审计委员会承接相关职权 | 今天 19:40 | 云财经 |
|
| 中国国航:副总裁郑为民退休离任 | 今天 19:20 | 云财经 |
|
| 证监会同意嘉立创深交所主板IPO注册 | 今天 18:04 | 云财经 |
|
| 华兰生物:控股子公司获新型佐剂流感病毒裂解疫苗临床试验批准 国内尚无同类佐剂流感疫苗获批上市 | 今天 17:59 | 云财经 |
|
| 锚定AI原生新赛道 移远携全系车载方案闪耀2026高通汽车峰会 | 今天 17:14 | 商业新闻 |
|
| 光纤概念板块短线拉升,鼎通科技涨超13% | 今天 09:44 | 云财经 |
|