韩国芯片新锐XCENA融资1.35亿美元:AI真正的瓶颈是内存不是算力

韩国芯片新锐XCENA融资1.35亿美元:AI真正的瓶颈是内存不是算力

XCENA融资1.35亿美元押注内存:AI推理的真正卡点不在GPU

韩国芯片创业公司XCENA完成1.35亿美元融资,估值5.7亿美元。这家公司的核心论点很直接:当前人工智能基础设施的最大瓶颈不是图形处理器算力,而是内存带宽和容量。这个判断正在被越来越多的行业数据所验证。

XCENA的技术路线是开发专用的内存处理芯片,把计算逻辑直接嵌入到内存单元中,减少数据在处理器和内存之间的搬运次数。这种架构被称为存内计算,理论上可以把大模型推理中的内存瓶颈降低一个数量级。传统架构下,数据需要在处理器和内存之间反复传输,每次传输都消耗时间和能量。

当前大语言模型推理面临的实际问题已经很清晰。以某主流开源大模型为例,七十亿参数版本的模型需要约一百四十吉字节显存,远超单张高端图形处理器的八十吉字节容量。即使使用多卡并行,内存带宽仍然是推理速度的限制因素。图形处理器的算力增长速度远快于内存带宽的增长速度,这个差距还在持续扩大。

XCENA创始人曾在韩国最大的半导体企业工作十五年,负责高带宽内存产品的研发。他在2023年离职创业,团队中有多名来自韩国两大内存制造商的资深架构师。这种人才配置说明XCENA赌的不是新概念,而是工程落地能力。韩国在内存芯片领域的全球市场份额超过百分之七十,人才储备是这个赛道最稀缺的资源。

存内计算赛道并非新概念,但此前多数公司停留在学术阶段。XCENA声称已经完成流片,计划在2027年第一季度向客户提供工程样品。首批客户定位在云服务商和大型人工智能实验室,而非终端设备制造商。云服务商对降低推理成本有最迫切的需求,也是最有支付能力的客户群。

投资方包括韩国产业银行、韩国互联网巨头旗下的风投基金和一家未披露名称的美国芯片设计公司。1.35亿美元的资金规模在芯片创业领域不算大,但对一家专注细分赛道的公司来说足够推进到量产前的最后验证阶段。芯片创业的烧钱速度远低于软件公司,关键节点是流片成功和客户验证。

内存瓶颈的另一个背景是成本。高带宽内存的价格在过去两年上涨了约三倍,已经成为人工智能基础设施成本中增速最快的部分。如果XCENA的方案能在保持性能的同时降低内存成本,市场空间会非常可观。全球人工智能推理市场预计在2027年达到四百亿美元规模,其中内存相关的成本占比正在逐年上升。