专注于大语言模型(LLM)工作负载的AI芯片初创企业MatX宣布完成了B轮融资。该公司由两位前谷歌TPU工程师创立,本轮融资吸引了包括世芯Aichip、美满Marvell在内的行业参与者及多家投资机构的参与。
MatX目前正在开发一款名为MatX One的AI芯片。该处理器采用可分割的脉动阵列结构,旨在结合大型阵列的能效与面积效率,以及小型阵列的灵活性和高利用率。同时,该设计综合了SRAM方案的低延迟优势和HBM方案在处理长上下文方面的能力。
据称,MatX One芯片旨在实现业界领先的LLM吞吐量,并保持与SRAM优先芯片相当的延迟水平。该芯片设计目标为适应训练、预填充、推理解码、强化学习等多种AI应用场景,其最终目标是帮助降低大语言模型的整体使用成本。


