在大语言模型推理流程中,KV Cache承担着存储历史对话信息、构建AI“实时记忆”的核心作用。随着大模型上下文窗口从4K Token快速扩张至128K Token,甚至迈向百万级Token, KV ...
在传统计算架构里,存储的职责更多是“存”。数据被写入、留存,在需要时调取,不需要时则静静停留在系统边缘。它长期是BOM成本中的一项,是容量规划的问题,而很少直接参与算力效率的定义。
而在2026年的CES上,英伟达直接自己做了一套面向KV Cache的存储层。由于英伟达的KV Cache存储层明确采用了SSD,而当前SSD市场正受供应紧张和价格上涨的影响,本就紧俏的市场再次被推向高潮。 老黄的这次发布,使SSD热度进一步升温,也直接带动了闪迪、美光、SK ...
如果大家关注存储行业近几年的发展,就不难发现这一系列变化的底层驱动力,正是AI产业的重心从训练向推理的转移。 对FADU中国区总经理康雷而言,这个观点不仅是其在CFMS | MemoryS 2026上演讲的主题,更是一个正在被市场验证的现实。rxgesmc 图1:FADU中国区总 ...
在当今的数字时代,存储设备的性能直接影响着工作效率和娱乐体验。固态硬盘(SSD)作为如今计算机中不可或缺的组件,其技术进步不断提升用户数据存储的体验。 然而,市场上有缓存SSD和无缓存SSD之间的选择,常常让人感到困惑。《IT时报》记者从技术原理 ...
今年年初,希捷IronWolf(酷狼)系列NAS盘家族迎来一位新成员,一款SATA口的2.5英寸SSD——IronWolf 110。几年前,存储厂商就开始将SSD用在企业级存储阵列里,希捷这款IronWolf 110定位在个人和小企业级,为NAS场景而优化,适用于连轴转的NAS场景。 IronWolf 110 SSD Data Sheet ...
随着PCIe 4.0技术的普及,目前市面上绝大部分主板都提供了PCIe 4.0接口。相对于PCIe 3.0技术,PCIe 4.0总线的数据传输带宽翻番,可以有效提升SSD、显卡的性能。因此存储厂商针对不同预算的用户推出了定位旗舰、主流的多款PCIe 4.0 SSD。其中最受关注的自然是价格 ...
随着人工智能,特别是大型语言模型(LLM)的飞速发展,全球算力需求呈指数级增长。然而,一个深刻的范式转换正在发生:AI工作负载的瓶颈正迅速从以GPU为核心的“算力”转向以数据存取为核心的“存力”。传统的存储架构已无法满足大模型训练与推理过程中对海量参 ...
作为一名深耕算力中心架构与分布式存储领域的“老兵”,最近在各大行业会议和技术沙龙中,我们听到频率最高的一个词就是 KV Cache 。 伴随着 DeepSeek 等国产大模型的强势崛起,不少用户陷入了“显存焦虑”:担心 GPU 显存被 KV ...
生成式AI的变革已经发生根本性的转变,从训练阶段建立大量的训练模型已经转换成推理模型。谁能提供最便宜、最快、最安全的推理AI,谁就能在这场变革中胜出,而存储已成为决定性的瓶颈…… 当全球AI产业经历从"炼模型"到"用模型"的关键转折,一场关于存储架构的静默革命正在数据中心深处酝酿。数据中心NAND bit需求正在经历的爆发式增长。根据铠侠(KIOXIA)在近日举行的CFMS | MemoryS 2 ...
TLC SSD的SLC Cache是个什么鬼? TLC SSD为了解决NAND Flash读写较慢的问题(后续论证),就为产品配备了SLC Cache,之所以称之为SLC Cache,是因为它并不是真正意义上的SLC NAND Flash,我们知道SLC NAND Flash因为每个Cell只存储1bit数据,所以读写速率全面领先MLC和TLC,TLC SSD ...
2026 开年,OpenClaw 的现象级爆发使大模型迅速迈入「超长上下文」时代。在几乎人人手捧「龙虾」穿梭于代码、搜索、办公自动化的当下,Token(词元)消耗成本正在迅速累积。据 OpenRouter 平台数据,2026 年 3 月单周 OpenClaw Token 消耗量占平台总量的 20%。用户实测单个会话的上下文可膨胀至 23 万 Token;重度使用场景的月成本甚至高达 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果