Taalas硬连线AI芯片集群跑DeepSeek R1，创下高吞吐速度纪录

发布时间：2026-02-21 10:02

AI芯片初创公司Taalas为解决大模型的延迟与成本问题，推出了“硬连线”技术，直接将AI模型固化在硅片中。在AI算力竞争激烈的背景下，延迟已成为制约智能体应用的核心瓶颈。

Taalas选择了激进的ASIC路线，其平台能将任意AI模型转化为定制硅片，核心在于“融合计算与存储”，将特定大语言模型的神经网络直接映射到硅片电路中，在DRAM级密度下完成所有计算。这种设计摒弃了高带宽内存、复杂封装及昂贵散热系统，从物理层面消除了数据传输的“内存墙”障碍。

该公司已展示其首款产品HC1，该芯片专为特定版本的Llama模型设计。从技术规格来看，HC1采用先进工艺制造，芯片面积较大。在线演示曾达到高tokens输出速度，但公司承认其模型版本经过了“激进”量化。巨大的芯片面积仅容纳了数十亿参数的模型，这表明为实现极致的硬连线速度，Taalas在单位面积的参数密度上做出了妥协，是该技术路线面临的主要物理限制之一。

尽管参数密度不高，但官方数据显示，相比现有的高端算力基础设施，Taalas方案的每秒Token生成数有显著提升，同时生产成本大幅降低。为解决单芯片容量问题，Taalas采用了集群化扩展策略。在针对DeepSeek R1模型的测试中，通过多芯片集群配置，实现了高TPS/User的吞吐速度。这一数据意味着在实时交互和复杂推理任务中，用户可能获得极低延迟的体验。

然而，该技术路线也面临独特挑战。由于模型权重被“硬连线”在硅片中，芯片一旦制造完成便无法更改模型参数。这意味着客户必须为特定的模型版本购买专用硬件，一旦算法迭代，硬件可能面临淘汰风险。

返回快讯列表