扫码加入

推理芯片

加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论
  • 寒武纪可能要爆了
    字节跳动推出的AI视频生成模型Seedance2.0正在全球引发热潮。 随着Seedance2.0的火爆,用户量和调用量急剧增长,AI视频生成正从实验阶段走向规模化应用,这种规模化应用意味着视频推理需求将呈现指数级增长。 推理侧需求井喷 与训练阶段不同,推理侧更强调芯片的能效比、延迟控制和成本优势。尤其是在大规模商业化部署中,企业对芯片的供货稳定性、国产合规性以及生态适配能力提出了更高要求。而当前
    寒武纪可能要爆了
  • 推理专用芯片,火了
    AI推理芯片成为规模化应用的关键,因其性能精准优化、能效比优势、成本效益显著和场景适配性灵活,满足不同应用场景需求。各大厂商纷纷推出创新产品,如LPU、SambaNova SN40L和谷歌TPU v6/v7,争夺市场份额。英伟达通过收购Groq,获得SRAM架构技术,降低成本并强化其在AI推理领域的领先地位。
    推理专用芯片,火了
  • 国产推理芯片,赢了英伟达?
    国产算力逐渐崛起,取代英伟达成为市场新宠。政府补贴高达80%,加上技术迭代和市场需求,推动国产算力商业化进程加快。推理场景成为国产算力的主要突破口,其性价比高于英伟达。随着应用场景成熟,国产芯片需求增加,进入卖方市场。超节点产品兴起,助力国产芯片在系统整体效率和规模化部署上超越英伟达。
    2523
    2025/11/20
    国产推理芯片,赢了英伟达?
  • 国产AI训练与推理芯片破局之战
    在全球人工智能军备竞赛的至暗时刻,一颗芯片的重量,足以压垮一个国家的智能未来。 当OpenAI用ChatGPT惊艳世界,当硅谷巨头们为争夺下一万张H100显卡而豪掷千金,一个冰冷的事实摆在我们面前:没有算力,所有关于大模型的豪言壮语都是空中楼阁。而算力的心脏——高端AI训练与推理芯片,正成为大国博弈中最关键的战略物资。 在这场没有硝烟的战争中,中国的科技产业正上演一场惊心动魄的破局之战。国产AI云
  • 国产AI推理芯片的双重博弈:围攻4090,谁能卡位成功?
    AI推理市场面临未来格局的不确定性和竞争压力,国产芯片公司正努力通过极致性价比超越英伟达4090,尤其是在信创、交通、能源、通信、消费等领域。尽管泛安防市场趋于饱和,但边缘和端侧市场仍有增长空间,特别是AI玩具、AI眼镜、AI戒指等新兴应用带来的端侧需求。国产芯片公司需抓住机遇,通过优化软件和硬件,提高性价比,争取在未来格局中的有利位置。
    1144
    2025/09/05
    国产AI推理芯片的双重博弈:围攻4090,谁能卡位成功?
  • 什么是真正好用的推理模型?阶跃Step 3:开源的,多模态的,低成本的,国产芯片适配的
    推理模型和具身智能,绝对是今年WAIC上最抢眼的存在。一个抢占了现阶段AI发展的话语权,一个是外界给予重望的“下一件有形之物”——尤其是推理模型这条线,逛展刚第二天,我的脑子已经有点“轰炸过载”了。
    什么是真正好用的推理模型?阶跃Step 3:开源的,多模态的,低成本的,国产芯片适配的
  • AI推理时代来临,云天励飞携“算力积木”架构破解国产化难题
    近日,云天励飞召开了主题为“智能芯生·推理未来”的媒体沟通会,正式宣布未来将全面聚焦人工智能(AI)推理芯片,并将围绕边缘计算、云端大模型推理、具身智能三大核心布局,打造国产AI推理“加速器”。
    AI推理时代来临,云天励飞携“算力积木”架构破解国产化难题
  • 英伟达依然坚挺
    DeepSeek并不是英伟达的竞争者,反而是大客户。但它的横空出世像一颗光芒耀眼的信号弹:是时候跟英伟达算算总账了。在英伟达身上栽过跟头的投资机构迅速团结起来,共同酝酿了一场价值5890亿美元的“1·27惨案”。
    英伟达依然坚挺
  • Groq芯片的创新意义
    前一阵子,Groq芯片刷屏了,据说Groq芯片计算速度远远超过英伟达GPU,经网友测试,Groq每秒生成速度接近500 tok/s,碾压GPT-4的40 tok/s。Groq是一家成立于2016年的AI创企,据其官网介绍,LPU是一种专为AI推理所设计的芯片。LPU的工作原理与GPU截然不同。它采用了时序指令集计算机(Temporal Instruction Set Computer)架构,这意味着它无需像使用高带宽存储器(HBM)的GPU那样频繁地从内存中加载数据。
    Groq芯片的创新意义
  • AI推理速度提升超10倍,Groq LPU能否取代英伟达GPU?
    2月20日消息,美国人工智能初创公司Groq最新推出的面向云端大模型的推理芯片引发了业内的广泛关注。其最具特色之处在于,采用了全新的Tensor Streaming Architecture (TSA) 架构,以及拥有超高带宽的SRAM,从而使得其对于大模型的推理速度提高了10倍以上,甚至超越了英伟达的GPU。
    1500
    2024/02/21
    AI推理速度提升超10倍,Groq LPU能否取代英伟达GPU?
  • 产业丨AI推理芯片,下一个[群模共舞]的入场券
    生产大模型并不是终极目标,让它在各行各业中大展拳脚、发挥出实用价值才是最终追求。
    产业丨AI推理芯片,下一个[群模共舞]的入场券
  • 云天励飞发布大模型推理芯片:14nm Chiplet架构,国内首创!
    11月15日,在第25界高交会上,云天励飞重磅发布新一代自主可控的面向边缘人工智能(AI)推理芯片DeepEdge10系列,最高算力可达48TOPS,支持D2D/C2C Mash互联扩展,可以满足千亿参数的大模型部署需求。
    云天励飞发布大模型推理芯片:14nm Chiplet架构,国内首创!
  • 大模型需求暴增,NPU有望在端边落地部署
    ChatGPT的火爆,让人们意识到AI其实有着更高的上限,也让业界更多关注到其背后的Transformer大模型。除了云端、除了自然语言处理,业界正在思考:是否可以让Transformer在端侧、边缘侧高效部署?是否可以让Transformer在计算机视觉领域发挥出更大潜能? 可能吗?爱芯元智已经开始了这一尝试。 Transformer何方神圣? GPT大模型,全称Generative Pre-t
    大模型需求暴增,NPU有望在端边落地部署
  • IAR Systems 与嘉楠科技达成合作,支持RISC-V内核高精度AI芯片
    嵌入式开发软件和服务的全球领导者 IAR Systems 与领先的端侧 AI 芯片研发供应商嘉楠科技今天共同宣布,最新推出的 Embedded Workbench for RISC-V 3.11.1版本已支持嘉楠勘智K510芯片,助力开发双核RISC-V 64位 AI 端侧推理芯片。

正在努力加载...