这家芯片初创公司刚刚筹集了1.35亿美元资金,押注人工智能最大的瓶颈不是计算,而是内存

每次您提出ChatGPT问题时,您的请求都会触发数据中继竞争。信息离开内存,通过CPU进行预处理,传输到GPU进行繁重计算,然后返回——对于人工智能生成的每个单词,整个过程都会重复。
瓶颈是结构性的——这意味着据每一个请求都要通过业内一些最昂贵、最耗电的芯片。这种效率低下的问题正是在韩国和美国设有办事处的初创公司XCENA试图解决的问题。这家成立四年的初创公司设计了一款芯片,其计算能力更接近DRAM(一种快速、短期的内存芯片,用于存储处理器正在使用的数据),允许在内存附近处理常规数据操作,而无需在CPU、GPU和内存之间进行昂贵的往返。
如果它大规模发挥作用,对人工智能基础设施成本的影响可能会很大,这在很大程度上解释了投资者对该公司的热情。事实上,XCENA刚刚在B轮融资中筹集了1.35亿美元,估值为5.7亿美元,使其融资总额达到1.85亿美元。
XCENACEOJin Kim于2022年与CTODohun Kim和首席产品官Harry Juhyun Kim共同创立了这家初创公司,他们都是三星和SK Hynix的资深人士,这两家内存巨头为Nvidia的GPU提供芯片支持。 “几十年来,CPU和GPU都变得更加智能。内存却从未如此。XCENA想要改变这一现状,”Jin Kim在接受TechCrunch采访时说道。他补充道:“最近内存价格和相关股票的上涨表明人工智能基础设施正在向以内存为中心的架构转变。” (本月,主导全球存储芯片市场的三家公司——三星、SK海力士和美光——各自的估值首次突破万亿美元。)
Kim表示,XCENA将其业务押注于“推理不仅仅是一个计算问题;它越来越成为一个内存扩展问题”。
XCENA的芯片MX1通过CXL(计算快速链路)连接到CPU——本质上是处理器和内存之间的专用快速通道——在数据需要离开内存模块之前对其进行处理。它将计算带入数据,而不是相反。该公司声称,过去需要10台服务器的内容现在可能只需要在一台服务器上运行。
“虽然GPU擅长矩阵乘法(AI模型训练背后的繁重数学),但大部分周围的数据编排,包括预处理、KV缓存管理(存储先前对话上下文的系统,因此模型不必重新处理它)和数据缓存,仍然在CPU上运行。我们的芯片直接在内存模块本身内处理这些任务,”Kim说。
自去年下半年以来,内存解决方案的需求激增,该公司相信时机对它有利。
与几家全球内存供应商的对话尚处于早期阶段,但Kim拒绝透露具体供应商的名称。该公司的理想客户是每年在人工智能基础设施上花费数百亿美元的超大规模企业,即使内存效率的微小提高也可能意味着数亿美元的节省。
MX1仍然是原型机。三星的代工线计划于2026年底前批量生产芯片,该公司预计从2027年开始产生收入。
虽然神经处理单元 (NPU) 制造商正在竞相挑战Nvidia的训练工作负载,但XCENA的目标是位于所有神经处理单元 (NPU) 之下的内存密集型层。
XCENA最接近的竞争对手包括Astera Labs和Marvell,这两家纳斯达克上市公司都致力于下一代内存连接。 Kim表示,Marvell是一家大型成熟企业,已经在同一领域开展工作,并补充说,差异化因素归结于知识产权。 “我们有数千个核心,”Kim说。相比之下,据公开规格,Marvell的方法依赖于少数通用核心。
这些内核基于RISC-V(一种开源芯片设计蓝图)构建,并专门针对数据处理进行了优化,每个内核都刻意保持小型和高效。除了内核本身之外,XCENA还设计了自己的内部存储器层次结构、互连总线和DRAM控制器,这是大多数芯片公司(包括较大的竞争对手)通常外包的垂直集成水平。
总部位于首尔的风险投资公司Atinum和IMM Investment与Corstone Asia以及现有投资者SBI Investment和Mirae Asset Capital共同领投了B轮融资。该公司在首尔郊外的科技中心板桥和桑尼维尔设有办事处,拥有90多名员工,该公司还在与国际投资者就额外资金进行谈判。