小九体育在线直播官网 谷歌新内存技巧炸翻传统存储芯片阛阓 大厂集体受挫

小九体育在线直播官网 谷歌新内存技巧炸翻传统存储芯片阛阓 大厂集体受挫

发布日期:2026-03-30 23:21    点击次数:65

小九体育在线直播官网 谷歌新内存技巧炸翻传统存储芯片阛阓 大厂集体受挫

好意思国东部时候3月26日,存储芯片股集体重挫,闪迪跌超11%,希捷跌逾8%,超威半导体、西部数据跌逾7%,好意思光科技跌近7%。

业内东谈主士分析,这一波动源自谷歌参谋院行将在国外学习表征会议(ICLR 2026)上认真亮相的学术论文,该参谋推出了一种新式AI内存压缩技巧“TurboQuant”。

谷歌声称,该技巧可将诳言语模子推理中的缓存内存占用压缩至六分之一,并在英伟达H100 GPU上已毕最高8倍的性能加快。

AI模子启动时存在一种“使命内存”,即KV缓存(Key-Value Cache)。每当模子措置信息、生成回当令,KV缓存便会连忙延迟,且潦倒文窗口越长,缓存占用的内存越大。

谷歌新内存技巧炸翻传统存储芯片阛阓 大厂集体受挫

TurboQuant履行上是一种极致的量化压缩算法,传统量化武艺需要在压缩精度和稀薄存储支出之间协调,小九体育直播而谷歌团队通过PolarQuant(极坐标量化)和QJL(量化JL变换)两项翻新,已毕了在“零赔本”前提下将KV缓存压缩至3-bit精度。

Cloudflare首席履行官将这一恶果称为谷歌的“DeepSeek时刻”,以为其有望像DeepSeek雷同,通过极致遵循大幅拉低AI的启动资本。

不外,摩根士丹利在最新研报中指出,阛阓对此存在误读。该技巧仅作用于推理阶段的键值缓存,并不影响模子权重所占用的高带宽内存(HBM),也与AI阅览任务无关。

分析师强调,所谓的“6倍压缩”并非存储总需求的减少,而是通过遵循擢升增多单GPU的婉曲量。这意味着在换取硬件条目下,不错复旧4倍至8倍更长的潦倒文,或在不触发内存溢出的前提下权贵擢升批措置鸿沟。

现在小九体育在线直播官网,谷歌尚未公布TurboQuant在Gemini等自研模子中的具体部署时候表,参谋团队策画不才个月的ICLR 2026会议上认真发布筹备恶果。

ag真人视讯中国官方网站



Copyright © 1998-2026 小九体育在线直播官网™版权所有

zsfdjhnzdl.com 备案号 备案号: -

技术支持:®小九体育  RSS地图 HTML地图