金博宝app手机版谷歌新内存本领炸翻传统存储芯片市集大厂集体受挫

好意思国东部时刻3月26日，存储芯片股集体重挫，闪迪跌超11%，希捷跌逾8%，超威半导体、西部数据跌逾7%，好意思光科技跌近7%。

业内东谈主士分析，这一波动源自谷歌联系院行将在海外学习表征会议（ICLR 2026）上厚爱亮相的学术论文，该联系推出了一种新式AI内存压缩本领“TurboQuant”。

谷歌声称，该本领可将大讲话模子推理中的缓存内存占用压缩至六分之一，并在英伟达H100 GPU上已毕最高8倍的性能加快。

AI模子脱手时存在一种“职责内存”，即KV缓存（Key-Value Cache）。每当模子解决信息、生成回复时，KV缓存便会飞速延迟，且高下文窗口越长，缓存占用的内存越大。

谷歌新内存本领炸翻传统存储芯片市集大厂集体受挫

TurboQuant履行上是一种极致的量化压缩算法，传统量化法度需要在压缩精度和稀奇存储支出之间和洽，188金宝博而谷歌团队通过PolarQuant（极坐标量化）和QJL（量化JL变换）两项改变，已毕了在“零亏损”前提下将KV缓存压缩至3-bit精度。

Cloudflare首席实践官将这一后果称为谷歌的“DeepSeek时刻”，合计其有望像DeepSeek同样，通过极致着力大幅拉低AI的脱手老本。

不外，摩根士丹利在最新研报中指出，市集对此存在误读。该本领仅作用于推理阶段的键值缓存，并不影响模子权重所占用的高带宽内存（HBM），也与AI锻真金不怕火任务无关。

分析师强调，所谓的“6倍压缩”并非存储总需求的减少，而是通过着力进步增多单GPU的迷糊量。这意味着在疏导硬件条目下，不错相沿4倍至8倍更长的高下文，或在不触发内存溢出的前提下显耀进步批解决领域。

现在金博宝app手机版，谷歌尚未公布TurboQuant在Gemini等自研模子中的具体部署时刻表，联系团队缱绻鄙人个月的ICLR 2026会议上厚爱发布联系后果。

乐鱼中国app官方网站首页

友情链接：