谷歌推出压缩算法TurboQuant 宣称实现约6倍内存节省
2026-03-26 11:00   
来源: 云财经   
影响力评估指数:16.38  
相关股票:
云财经讯,谷歌近日推出了一种可能降低人工智能(161631)系统内存需求的压缩算法TurboQuant。根据谷歌介绍,TurboQuant压缩技术旨在降低大语言模型和向量搜索引擎的内存占用。该算法主要针对AI系统中用于存储高频访问信息的键值缓存(key-value cache)瓶颈问题。随着上下文窗口变大,这些缓存正成为主要的内存瓶颈。TurboQuant可在无需重新训练或微调模型的情况下,将键值缓存压缩至3bit精度,同时基本保持模型准确率不受影响。对包括Gemma、Mistral等开源模型的测试显示,该技术可实现约6倍的键值缓存内存压缩效果。此外,在英伟达H100加速器上的测试结果显示,与未量化的键向量相比,该算法最高可实现约8倍性能提升。研究人员也表示,这项技术的应用不局限于AI模型,还包括支撑大规模搜索引擎的向量检索能力。谷歌计划于4月的国际学习表征会议(ICLR 2026)上展示TurboQuant技术。
云财经智能匹配相关概念
| 新闻标题 | 时间 | 消息来源 | 新闻热度 |
|---|---|---|---|
| 35周年司庆季臻心之作:中国太保寿险“颐护添年”保障计划上市 | 今天 17:45 | 商业新闻 |
|
| 国务院任命香港特别行政区政府政制及内地事务局局长 | 今天 09:14 | 云财经 |
|
| 美国华盛顿举行集会 抗议美以对伊朗军事行动 | 03-29 11:57 | 云财经 |
|
| 春假叠加清明假期出行热度高涨 | 03-29 09:32 | 云财经 |
|
| 特朗普的一些年轻支持者因伊朗战争问题转而反对他 | 03-29 04:13 | 云财经 |
|
| 泰国就本国油轮通行霍尔木兹海峡与伊朗达成协议 | 03-28 14:41 | 云财经 |
|