在与英伟达的AI算力竞赛中,芯片初创公司Cerebras Systems再次亮出了自己的王牌。该公司正式发布了其最新、最强大的AI芯片——第三代晶圆级引擎(Wafer-Scale Engine 3, WSE-3)。这款芯片专为训练业界最大规模的AI模型而设计,其性能参数直接对标并试图超越英伟达的旗舰产品。
技术的巨大飞跃
WSE-3的核心创新在于其“晶圆级”设计理念,即将一整块硅晶圆打造成一个单一的、巨大的处理器。与将晶圆切割成数百个独立芯片(如GPU)的传统方法相比,这种设计极大地提升了片上内存和核心间的通信带宽,从而消除了多芯片系统中的性能瓶颈。
WSE-3基于台积电的5纳米工艺制造,其性能相比前代WSE-2实现了翻倍。它集成了惊人的4万亿个晶体管和90万个专门为AI计算优化的核心。这使其能够提供高达125 Petaflops的峰值AI算力,足以支持训练拥有24万亿个参数的AI模型,这一规模是当前最大模型(如GPT-4)的十倍以上。
Cerebras CS-3 AI超级计算机
WSE-3是Cerebras新推出的CS-3 AI超级计算机的核心。该公司强调,部署和编程一个CS-3系统远比配置一个由数千个GPU组成的复杂集群要简单得多。CS-3系统提供了便捷的内存扩展能力,最高可支持1.2 Petabytes的外部内存,能够轻松处理海量数据集。
WSE-3 关键技术参数:
晶体管数量: 4万亿个
AI核心数量: 900,000个
片上SRAM: 44GB
峰值AI性能: 125 Petaflops
制造工艺: 台积电5纳米
Cerebras的首席执行官Andrew Feldman表示,WSE-3旨在为那些希望训练下一代超大模型的机构提供一个强大且易于使用的解决方案。公司的客户包括大型企业、政府机构和云服务提供商,例如与G42合作打造的Condor Galaxy超级计算机。Cerebras的策略是通过提供一个与主流GPU架构(如CUDA)兼容的软件栈,来降低用户的迁移成本,从而在由英伟达主导的高端AI训练市场中开辟出一条独特的竞争路径。