Taalas硬连线AI芯片集群跑DeepSeek R1,创下高吞吐速度纪录

发布时间:2026-02-21 10:02

AI芯片初创公司Taalas为解决大模型的延迟与成本问题,推出了“硬连线”技术,直接将AI模型固化在硅片中。在AI算力竞争激烈的背景下,延迟已成为制约智能体应用的核心瓶颈。

Taalas选择了激进的ASIC路线,其平台能将任意AI模型转化为定制硅片,核心在于“融合计算与存储”,将特定大语言模型的神经网络直接映射到硅片电路中,在DRAM级密度下完成所有计算。这种设计摒弃了高带宽内存、复杂封装及昂贵散热系统,从物理层面消除了数据传输的“内存墙”障碍。

该公司已展示其首款产品HC1,该芯片专为特定版本的Llama模型设计。从技术规格来看,HC1采用先进工艺制造,芯片面积较大。在线演示曾达到高tokens输出速度,但公司承认其模型版本经过了“激进”量化。巨大的芯片面积仅容纳了数十亿参数的模型,这表明为实现极致的硬连线速度,Taalas在单位面积的参数密度上做出了妥协,是该技术路线面临的主要物理限制之一。

尽管参数密度不高,但官方数据显示,相比现有的高端算力基础设施,Taalas方案的每秒Token生成数有显著提升,同时生产成本大幅降低。为解决单芯片容量问题,Taalas采用了集群化扩展策略。在针对DeepSeek R1模型的测试中,通过多芯片集群配置,实现了高TPS/User的吞吐速度。这一数据意味着在实时交互和复杂推理任务中,用户可能获得极低延迟的体验。

然而,该技术路线也面临独特挑战。由于模型权重被“硬连线”在硅片中,芯片一旦制造完成便无法更改模型参数。这意味着客户必须为特定的模型版本购买专用硬件,一旦算法迭代,硬件可能面临淘汰风险。

客服微信
客服微信