据知情人士消息,Meta在自研AI芯片方面遭遇重大挫折,已放弃其最先进的训练芯片项目,并将开发重点转向结构更简单的替代方案。由于芯片设计难度超出预期,Meta决定取消正在开发的高端AI训练芯片。
Meta调整芯片战略的同时,也在加强与现有芯片供应商的合作。据报道,Meta已签署协议从谷歌租用AI芯片。AMD也表示将与Meta合作部署其Instinct AI芯片。此外,Meta本月还宣布与英伟达建立跨多代合作关系,将继续在数据中心部署英伟达芯片。
Meta自研芯片属于“Meta训练和推理加速器”(MTIA)项目,目标是降低对外部供应商的依赖,同时减少数据中心运营成本并增强基础设施控制能力。Meta已放弃其第二代训练芯片Iris的一个版本,并随后启动更先进芯片Olympus的开发,但该项目同样遭到了夭折的命运。
公司内部对能否开发出可与英伟达性能匹敌的芯片持怀疑态度,原因包括开发周期长、设计复杂以及功耗控制难度高。在技术架构方面,Iris采用单指令多数据(SIMD)架构,这种架构更易于硬件设计,但软件开发难度较高。Olympus则采用单指令多线程(SIMT)架构,与英伟达芯片类似,更适合AI训练软件,但硬件实现复杂度更高。
Meta原计划基于Olympus构建大规模AI训练服务器集群,但管理层认为,这一方案存在风险,可能影响公司在AI竞争过程中训练新模型的进度。此外,软件成熟度可能不及英伟达生态,而复杂设计也可能增加量产难度。因此,Meta目前计划继续依赖外部供应商提供的AI训练芯片,因为这些芯片的软件生态更加成熟,风险更低。


