当RISC-V从轻量级计算领域向高性能计算(HPC)领域拓展时,业界普遍对其发展前景持谨慎观望态度,对其最终能在这一方向走多远并无十足信心。直至Tenstorrent对外公布其高性能CPU TT-Ascalon已正式落地。
早在去年年末,Tenstorrent便向外界透露,计划于今年推出其自主研发的CPU IP核。该IP核基于开源RISC-V指令集架构打造,具备高性能与可扩展性。今年12月4日,在Tenstorrent Blueprint China技术峰会上,Tenstorrent正式宣布TT-Ascalon成功落地,并全面展示了RISC-V在HPC领域的应用潜力。
性能强大
Tenstorrent的团队拥有高性能x86和ARM IP设计的丰富经验,Ascalon证明了他们的实力。该产品拥有超200万行代码,符合RVA23标准,不仅支持Hypervisor、安全功能,还支持最新的RISC-V向量扩展。
图:基于RISC-V的高性能CPU Ascalon
在Samsung SF4X工艺节点的加持下,Ascalon能够实现超过2.5 GHz的主频,且采用DFT嵌入式设计。
Ascalon的单核性能表现极为卓越,达到22 SPECint® 2006/GHz,超过2.3 SPECint® 2017/GHz以及3.6 SPECfp® 2017/GHz。同时,它在GCC和LLVM中均已完成优化,无疑是行业内的领先产品。
产品布局
Divyang Agrawal称,RISC-V是Tenstorrent各项工作的根基,深度融入每一个产品,无论是自主研发的核、开源核,还是第三方IP,均有RISC-V的“身影”。
当前,高性能与AI服务器领域对RISC-V技术的需求愈发迫切,Tenstorrent凭借其独特的产品生态,有望为这一领域带来变革。
Divyang Agrawal表示,他们不仅提供Ascalon,还考虑到其与GPU、内存及存储的组合。这些产品在设计之初便充分考虑了不同使用场景,具备高度可配置性。从单核到八核集群,支持共享缓存,可灵活配置高性能向量单元及集群周边组件(如调试与追踪模块)。同时,全面兼容最新PCIe和AXI接口,轻松应对多样化的应用需求。
图:Tenstorrent IP产品布局
系统IP作为软件与编程设计交互的桥梁,至关重要。Tenstorrent通过系统IP实现了符合RISC-V标准的应用程序接口,如中断控制器、内存管理单元(IOMMU)等。客户在获取IP构建SoC时,将获得一套完整的解决方案,从而大幅简化开发流程,加速产品上市时间。
芯片可调试(DFD)能力是确保产品稳定性的基石。Tenstorrent在设计中融入了调试、追踪、安全JTAG模式等功能,并提供了全面的芯片工具链和软件团队支持。此外,该公司还提供了丰富的软件开发、支持和配套资料,全方位保障IP能够顺利整合到设计项目中。
明年,Tenstorrent将推出基于RISC-V架构的高性能芯片开发平台Atlantis。该平台性能强劲,能够支持软件开发覆盖多个领域。Divyang Agrawal表示,当前现有RISC-V开发平台对高性能软件开发存在诸多限制,而Atlantis则能让开发者快速获得反馈,有效扩展生态系统。
Alexandria是一款具备安全架构的高性能CPU,其第一代产品主要面向汽车和机器人技术市场。该CPU IP兼容RVA23标准,具备可配置核心数量和二级缓存大小的选项,支持先进RAS架构,并提供ASIL D和ASIL B两种产品选择。
Alexandria配备专为自身优化的STL,并整合至3nm汽车认证技术节点,计划于2026年第三季度发布。初期将推出两款配置:四核搭配4兆字节的ASIL B CPU IP,以及八核搭配12兆字节的ASIL B CPU IP。随后将迅速推出八核、12兆字节的ASIL D和B兼容CPU IP,支持锁定模式或混合模式配置。
Tenstorrent为其IP产品制订了详细的路线图。目前,第一代产品已准备就绪,生态系统也已做好接受询问和部署的准备;第二代产品正在紧锣密鼓地设计中;Alexandria第一代汽车IP将于明年上市,后续还将推出更高性能、优化功耗和面积的产品。
图:Tenstorrent IP产品规划
除了强大的硬件平台外,Tenstorrent还凭借其内部开发能力构建了丰富的软件堆栈。该软件堆栈支持不同版本Linux,并对GCC和LLVM工具链进行了深度优化。所有优化均可在上游获取,为用户提供了便捷、高效的开发环境。
作为拥有约15年历史的开放标准和全新架构,RISC-V为Tenstorrent带来了ISA能力优势,并允许其进行灵活修改。这使得Tenstorrent的定制化能力可在多个层面展开,包括ISA、核心微架构、集群配置、系统IP到子系统层面。
通过提供包含核心、集群、系统、IP架构和软件工具在内的全栈式解决方案,Tenstorrent正为开发者提供一个强大的参考平台。这不仅加速了RISC-V生态的发展,更为整个行业注入了新的活力与机遇。
生态合作
三年前,为加速反馈闭环,Tenstorrent与CoreLab达成深度合作,共同推进IP定制化进程。Tenstorrent IP战略副总裁Aniket Saha强调,公司自成立之初便致力于构建开放共赢的合作伙伴生态系统。选择RISC-V架构,正是为了帮助客户摆脱传统供应商的软件依赖与锁定限制,实现技术自主可控。
目前,高性能RISC-V芯片市场存在显著缺口,而Atlantis的推出改变了这一局面。围绕Atlantis的RISC-V IP,将形成一个强大且充满活力的开发者生态系统。该IP组合具备开放性和高度可定制化特性,芯片设计验证流程可靠且可扩展,为开发者提供了灵活性与创新空间。
Tenstorrent将汽车与机器人市场视为首要市场目标,这两个领域的深度融合应用为高性能计算提供了广阔空间。
Aniket Saha指出,随着主权计算需求的日益增长,Tenstorrent推出了“创新许可”IP业务模式。这一模式赋予合作伙伴与客户完全的技术自主权,允许其自由拥有、修改及构建技术,且无需承担版税等额外费用。
这一创新模式在人工智能领域尤为适用,该领域模型迭代迅速,需频繁接触底层技术进行性能调优。作为同时拥有训练、推理及计算IP的供应商,Tenstorrent的灵活授权模式使用户能够在底层层面实现性能与功耗的极致优化。
Tenstorrent强调他们在推动RISC-V生态系统创新上的努力,Atlantis可以说是一个典型的实例——这款基于Ascalon的开发板,以及基于Atlantis的RISC-V社区设计的开发板Atlantis Customer Enablement Board,都是和CoreLab合作完成。
图:基于Atlantis的开发板由Tenstorrent和CoreLab合作完成
两家公司合作为客户提供定制服务,包括CPU核心数和SoC层面的定制。结合Tenstorrent的CPU架构设计能力和CoreLab的中国专属技术支持,双方将为社区提供培训、开发者论坛、SDK软件更新和发布以及月度newsletter等持续贡献。
CoreLab董事长吴雄昂表示,未来计算架构必将走向开放,其生态构建需依赖合作伙伴的共同努力。CoreLab与Tenstorrent的独家合作,旨在共同打造本土生态,为中国AI创新提供更强有力的支持。依托CoreLab的OpenCSS(开放可定制计算系统平台)这一针对AI/机器人的开源平台,双方期待培育出更多如宇树般的本土AI创新明星企业。
另一个典型实例是OCA(Open Chiplet Atlas Ecosystem,开放芯粒生态系统),该系统有效解决了高性能芯片设计门槛及成本不断攀升的问题。OCA以芯粒与生态为核心,通过分工协作与开放贸易交换,显著提升生产力并降低设计成本。
Tenstorrent从六个方向支持OCA生态系统:OCA架构(保障互可操作性)、OCA Harness(开源芯粒系统逻辑实现)、OCA Compliance(芯粒合规性测试)、OCA Chiplet Shell(简化设计复杂度)、OCA Chiplet(开发多样芯粒)及OCA芯粒模型(协同仿真)。
可以看到,OCA的芯粒复用与设计复用的实现,都建立在生态广泛合作的基础上。
结语
作为一款极具雄心的产品,Ascalon代表了RISC-V生态向高性能计算领域进军的最前沿的努力之一,有望在未来的计算格局中扮演越来越重要的角色。
“大幅降低人工智能与硅片成本”,这是Tenstorrent首席执行官,芯片界传奇人物,号称“硅仙人”的Jim Keller对其公司使命的定义。他希望公司能深度践行开源理念,通过共享开源软件堆栈赋能人工智能,并依托开源架构RISC-V实现技术自主可控——既无需支付授权费用,又能自由修改架构并反哺开源生态。
1525