谷歌推出压缩算法实现约6倍内存节省【今日】

发布日期：2026-03-27 23:04:43 来源：互联网作者：56之窗网浏览次数：10

谷歌近日推出了一种新的压缩算法TurboQuant，旨在降低人工智能系统的内存需求。该算法特别针对大语言模型和向量搜索引擎中的键值缓存瓶颈问题。随着上下文窗口的增大，这些缓存成为主要的内存瓶颈。TurboQuant可以在无需重新训练或微调模型的情况下，将键值缓存压缩至3比特精度，并且基本保持模型准确率不受影响。

测试结果显示，TurboQuant对包括Gemma和Mistral在内的开源模型实现了约6倍的键值缓存内存压缩效果。在英伟达H100加速器上的测试中，与未量化的键向量相比，该算法最高可实现约8倍的性能提升。研究人员表示，这项技术不仅适用于AI模型，还能增强大规模搜索引擎的向量检索能力。谷歌计划在2026年4月的国际学习表征会议上展示这一技术。

关键词： 谷歌推出压缩算法

　　以上就是【谷歌推出压缩算法实现约6倍内存节省【今日】】全部内容，更多资讯请关注56之窗网。

本文地址:http://hot.ffsy56.com/newsdetail2049932.html

版权与免责声明：以上所展示的信息由网友自行发布，内容的真实性、准确性和合法性由发布者负责。56之窗网对此不承担任何直接责任及连带责任，56之窗网仅提供信息存储空间服务。任何单位或个人如对以上内容有权利主张（包括但不限于侵犯著作权、商业信誉等），请与我们联系并出示相关证据，我们将按国家相关法规即时移除。

推荐图文

94版三国演义司马懿饰	总数找到时代峰峻辟谣
总数找到刘恺威否认新	高考试卷过上了人民币
总数找到林俊杰母亲回	欧亚经济联盟要亚美尼
王灿因病切了一片肺	第28届上影节金爵奖入