扫码加入

AI推理

加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

电路方案

查看更多
  • 把大模型刻进芯片,可行吗?
    Taalas是一家成立于2023年的加拿大初创公司,凭借其HC1芯片在AI推理领域引起广泛关注。该公司采用了独特的设计思路,将AI大模型的权重直接蚀刻到芯片的金属互连层中,实现了极致的存算合一,使推理速度达到17000 tokens/秒,远超现有GPU。然而,这种极端专用化的设计使得芯片仅能运行特定模型,且每次模型更新都需要重新流片,这对其商业可行性提出了挑战。 尽管如此,Taalas的方案在某些特定场景中展现了独特价值,例如工业自动化、政务系统和消费电子产品等领域,能够有效解决推理延迟问题。然而,其高昂的成本和较长的迭代周期仍是主要争议点。总体而言,Taalas的尝试为AI芯片设计提供了新的视角,尤其是在存算合一和定制化硬件的方向上,有望在未来推动AI硬件向多元化和场景化发展。
    把大模型刻进芯片,可行吗?
  • 猛攻AI PC市场,第三代酷睿Ultra只用了「一半」实力
    英特尔第三代酷睿Ultra处理器凭借Intel 18A制程实现了高能效和高性能,适用于AI PC市场。该处理器在AI推理领域表现出色,具有200种产品设计,覆盖多种应用场景。英特尔通过软件优化和硬件升级,提升了处理器的整体性能和续航能力,使其在办公和游戏市场占据领先地位。此外,第三代酷睿Ultra还展示了其在物理AI领域的潜力,特别是针对边缘计算和工业AI设备的广泛应用前景。
    1682
    01/14 17:24
    猛攻AI PC市场,第三代酷睿Ultra只用了「一半」实力
  • 刚刚,黄仁勋一口气解密6颗芯片,召唤出最强AI超算!
    英伟达在CES 2026上推出了多个新产品,包括NVIDIA Vera Rubin POD AI超级计算机、NVIDIA Spectrum-X以太网共封装光学器件、NVIDIA推理上下文内存存储平台和基于DGX Vera Rubin NVL72的NVIDIA DGX SuperPOD。这些产品旨在提高AI推理效率和降低成本,同时扩大开源模型生态系统,推动物理AI的发展。
    刚刚,黄仁勋一口气解密6颗芯片,召唤出最强AI超算!
  • 推理专用芯片,火了
    AI推理芯片成为规模化应用的关键,因其性能精准优化、能效比优势、成本效益显著和场景适配性灵活,满足不同应用场景需求。各大厂商纷纷推出创新产品,如LPU、SambaNova SN40L和谷歌TPU v6/v7,争夺市场份额。英伟达通过收购Groq,获得SRAM架构技术,降低成本并强化其在AI推理领域的领先地位。
    推理专用芯片,火了
  • 重磅!黄仁勋罕见出手,欧美AI芯片独角兽集体谢幕
    硅谷AI芯片独角兽Groq宣布与英伟达达成非独家授权协议,授权英伟达使用Groq的推理技术。Groq团队成员将加入英伟达,以帮助推进和扩大授权技术的规模。Groq将继续作为一家独立公司运营,Simon Edwards将担任CEO。GroqCloud将继续正常运营,不会中断。这一协议体现了双方共同致力于扩大高性能、低成本推理技术的应用范围。
    1309
    2025/12/30
    重磅!黄仁勋罕见出手,欧美AI芯片独角兽集体谢幕