金博宝app手机版 谷歌新内存本领炸翻传统存储芯片市集 大厂集体受挫

好意思国东部时刻3月26日,存储芯片股集体重挫,闪迪跌超11%,希捷跌逾8%,超威半导体、西部数据跌逾7%,好意思光科技跌近7%。
业内东谈主士分析,这一波动源自谷歌联系院行将在海外学习表征会议(ICLR 2026)上厚爱亮相的学术论文,该联系推出了一种新式AI内存压缩本领“TurboQuant”。
谷歌声称,该本领可将大讲话模子推理中的缓存内存占用压缩至六分之一,并在英伟达H100 GPU上已毕最高8倍的性能加快。
AI模子脱手时存在一种“职责内存”,即KV缓存(Key-Value Cache)。每当模子解决信息、生成回复时,KV缓存便会飞速延迟,且高下文窗口越长,缓存占用的内存越大。

TurboQuant履行上是一种极致的量化压缩算法,传统量化法度需要在压缩精度和稀奇存储支出之间和洽,188金宝博而谷歌团队通过PolarQuant(极坐标量化)和QJL(量化JL变换)两项改变,已毕了在“零亏损”前提下将KV缓存压缩至3-bit精度。
Cloudflare首席实践官将这一后果称为谷歌的“DeepSeek时刻”,合计其有望像DeepSeek同样,通过极致着力大幅拉低AI的脱手老本。
不外,摩根士丹利在最新研报中指出,市集对此存在误读。该本领仅作用于推理阶段的键值缓存,并不影响模子权重所占用的高带宽内存(HBM),也与AI锻真金不怕火任务无关。
分析师强调,所谓的“6倍压缩”并非存储总需求的减少,而是通过着力进步增多单GPU的迷糊量。这意味着在疏导硬件条目下,不错相沿4倍至8倍更长的高下文,或在不触发内存溢出的前提下显耀进步批解决领域。
现在金博宝app手机版,谷歌尚未公布TurboQuant在Gemini等自研模子中的具体部署时刻表,联系团队缱绻鄙人个月的ICLR 2026会议上厚爱发布联系后果。
乐鱼中国app官方网站首页
备案号: