AI推理

加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论
  • 猛攻AI PC市场,第三代酷睿Ultra只用了「一半」实力
    英特尔第三代酷睿Ultra处理器凭借Intel 18A制程实现了高能效和高性能,适用于AI PC市场。该处理器在AI推理领域表现出色,具有200种产品设计,覆盖多种应用场景。英特尔通过软件优化和硬件升级,提升了处理器的整体性能和续航能力,使其在办公和游戏市场占据领先地位。此外,第三代酷睿Ultra还展示了其在物理AI领域的潜力,特别是针对边缘计算和工业AI设备的广泛应用前景。
    1164
    01/14 17:24
    猛攻AI PC市场,第三代酷睿Ultra只用了「一半」实力
  • 刚刚,黄仁勋一口气解密6颗芯片,召唤出最强AI超算!
    英伟达在CES 2026上推出了多个新产品,包括NVIDIA Vera Rubin POD AI超级计算机、NVIDIA Spectrum-X以太网共封装光学器件、NVIDIA推理上下文内存存储平台和基于DGX Vera Rubin NVL72的NVIDIA DGX SuperPOD。这些产品旨在提高AI推理效率和降低成本,同时扩大开源模型生态系统,推动物理AI的发展。
    刚刚,黄仁勋一口气解密6颗芯片,召唤出最强AI超算!
  • 推理专用芯片,火了
    AI推理芯片成为规模化应用的关键,因其性能精准优化、能效比优势、成本效益显著和场景适配性灵活,满足不同应用场景需求。各大厂商纷纷推出创新产品,如LPU、SambaNova SN40L和谷歌TPU v6/v7,争夺市场份额。英伟达通过收购Groq,获得SRAM架构技术,降低成本并强化其在AI推理领域的领先地位。
    推理专用芯片,火了
  • 重磅!黄仁勋罕见出手,欧美AI芯片独角兽集体谢幕
    硅谷AI芯片独角兽Groq宣布与英伟达达成非独家授权协议,授权英伟达使用Groq的推理技术。Groq团队成员将加入英伟达,以帮助推进和扩大授权技术的规模。Groq将继续作为一家独立公司运营,Simon Edwards将担任CEO。GroqCloud将继续正常运营,不会中断。这一协议体现了双方共同致力于扩大高性能、低成本推理技术的应用范围。
    重磅!黄仁勋罕见出手,欧美AI芯片独角兽集体谢幕
  • 3000亿摩尔线程亮家底 :我真的就是英伟达
    摩尔线程在MDC 2025大会上展示了新一代指令集“花港”及其基于此架构的两颗芯片——AI训推一体芯片“华山”和高性能图形渲染芯片“庐山”。同时,摩尔线程发布了旗舰产品MTT S5000,并宣布要构建十万卡集群以满足大模型训练需求。此外,摩尔线程还推出了一系列新产品和服务,包括边缘计算解决方案、个人智算中心MTT AIBOOK和家庭AI NAS功能的MTT AICUBE,以及具身智能、量子计算和6G AI领域的多项合作与研发计划。
    3000亿摩尔线程亮家底 :我真的就是英伟达
  • 狂飙的算力基建,如何实现「价值闭环」?
    2025年AI推理市场步入爆发前夜,MaaS市场规模增长显著,部分大厂预判明年增速可达10倍。多模态技术快速发展,尤其是图片领域,技术迭代速度快,未来潜力巨大。算力基建需实现商业闭环,方便、易用、便宜是关键。液冷技术有助于降低能耗,提高设备稳定性。推理需求爆发需依赖大模型能力突破,多模态应用效果稳定化是核心。AI眼镜等硬件产品有望推动Token消耗爆发式增长。
    733
    2025/12/19
    狂飙的算力基建,如何实现「价值闭环」?
  • 对话华为樊杰:AI落地浪潮下的存力革新
    华为推出端到端存储解决方案,助力AI行业模型落地,解决数据汇集、训练和推理阶段的瓶颈,通过高性能存储和AI SSD优化算力利用率,提高推理速度并降低应用门槛。
    对话华为樊杰:AI落地浪潮下的存力革新
  • Altera CEO任后首次访华:独立的FPGA,是AI时代最灵活的“答案”
    Altera的独立启航,正为全球半导体产业生态带来深远的变局。这不仅是一家公司的战略转型,更是塑造未来算力格局的重要力量。
    1690
    2025/11/10
  • 基于PCIe 6的下一代推理服务器扩展技术
    本文探讨了 PCIe Gen6 在下一代 AI 推理服务器扩展中的应用,重点介绍了其技术背景、核心方案、性能优势及实践建议。文章指出,AI 推理服务器扩展面临三大挑战:推理计算需求激增、信号传输限制和内存需求。PCIe Gen6 和 CXL 3.x 是解决这些问题的关键技术,前者提供高带宽和低延迟,后者则通过内存池化和共享解决了内存瓶颈。此外,文章还介绍了重定时器、Gearbox 和 PCIe 交换机等关键技术组件如何突破扩展限制,并展示了性能验证结果。最后,提出了一种“目的导向型机架级 AI 互联”的设计方案,适用于不同规模的推理集群。
    基于PCIe 6的下一代推理服务器扩展技术
  • 10倍带宽突破、市值暴涨200亿美元,高通能否「分食」千亿级AI推理市场?
    高通推出AI推理芯片,迎战英伟达,股价大涨22%,市值单日增加近200亿美元。尽管高通主打低TCO概念,但在实际场景中的竞争力还需验证。高通与沙特AI公司HUMAIN合作,计划部署大量AI200、AI250机架解决方案。高通的AI推理芯片支持更大显存容量和更高内存架构,有助于提高AI推理工作负载效能。高通在软件生态建设上也有所发力,为产品落地铺路。
    576
    2025/11/03
    10倍带宽突破、市值暴涨200亿美元,高通能否「分食」千亿级AI推理市场?
  • 英特尔18A高能量产在即,凭什么重构AI下半场芯片逻辑?(上篇)
    18A作为英特尔技术翻身仗的基石,在性能、功耗和密度上都实现了显著提升,并且正被高效地转化为可量产、有竞争力的产品。
  • 研报 | AI推理催化大容量储存产品结构性改变,Nearline SSD需求急升
    TrendForce集邦咨询预测,未来两年AI基础设施建设重点将转向高效推理服务,导致传统HDD供不应求,促使NAND Flash供应商推出专为Inference AI设计的Nearline SSD。QLC技术因其低本高容特性,成为解决大容量需求的关键。预计至2026年,Enterprise SSD供应紧张,而NAND Flash应用多元化趋势明显,除Inference AI外,还涉及AI Training。两大阵营分别采用HBM与SCM技术,竞争激烈,推动NAND Flash应用向更深层次AI运算整合迈进。
    研报 | AI推理催化大容量储存产品结构性改变,Nearline SSD需求急升
  • 甲骨文大涨,算力疯狂
    甲骨文市值飙升2510亿美元,登顶全球首富,主要得益于巨额订单和云业务预期的暴增。甲骨文深度绑定AI算力服务赛道,与英伟达和AMD形成双供应商战略,计划采购大量GPU和AI芯片。然而,GPU和ASIC的供应瓶颈加剧,引发市场担忧。甲骨文和博通作为“AI时代的卖铲人”,股价大幅上涨,但也面临客户集中度风险和利润低等问题。
    甲骨文大涨,算力疯狂
  • 国产AI推理芯片的双重博弈:围攻4090,谁能卡位成功?
    AI推理市场面临未来格局的不确定性和竞争压力,国产芯片公司正努力通过极致性价比超越英伟达4090,尤其是在信创、交通、能源、通信、消费等领域。尽管泛安防市场趋于饱和,但边缘和端侧市场仍有增长空间,特别是AI玩具、AI眼镜、AI戒指等新兴应用带来的端侧需求。国产芯片公司需抓住机遇,通过优化软件和硬件,提高性价比,争取在未来格局中的有利位置。
    1100
    2025/09/05
    国产AI推理芯片的双重博弈:围攻4090,谁能卡位成功?
  • 什么是真正好用的推理模型?阶跃Step 3:开源的,多模态的,低成本的,国产芯片适配的
    推理模型和具身智能,绝对是今年WAIC上最抢眼的存在。一个抢占了现阶段AI发展的话语权,一个是外界给予重望的“下一件有形之物”——尤其是推理模型这条线,逛展刚第二天,我的脑子已经有点“轰炸过载”了。
    什么是真正好用的推理模型?阶跃Step 3:开源的,多模态的,低成本的,国产芯片适配的
  • AI推理时代来临,云天励飞携“算力积木”架构破解国产化难题
    近日,云天励飞召开了主题为“智能芯生·推理未来”的媒体沟通会,正式宣布未来将全面聚焦人工智能(AI)推理芯片,并将围绕边缘计算、云端大模型推理、具身智能三大核心布局,打造国产AI推理“加速器”。
    AI推理时代来临,云天励飞携“算力积木”架构破解国产化难题
  • 上海GPU云服务商冲刺港交所!猛吃DeepSeek红利,创始人曾打造PPTV
    AI推理工作负载越来越具有低时延和高并发要求的特点。曾经非常适合大规模AI训练的集中式云端架构,现时已不再适合满足现代推理的需求
    992
    2025/06/23
    上海GPU云服务商冲刺港交所!猛吃DeepSeek红利,创始人曾打造PPTV
  • 【一文看懂】什么是视觉推理?
    上周,OpenAI发布了新款AI模型o3和o4-min。OpenAI官方称,o3和o4-mini是首批能够“图像思维”的AI模型:“这是我们首次推出能够独立使用全部ChatGPT工具的推理模型——包括网页浏览、Python编程、图像理解和图像生成能力。这使得它们在解决复杂的多步骤问题时更加高效,并朝着自主执行任务的方向迈出了真正一步。”
    【一文看懂】什么是视觉推理?
  • 从生成式到推理模型:AI应用的未来演进与商业机会
    人工智能技术正在重塑产业格局,大模型作为核心技术引擎,从成本优化到商业模式革新,从智能设备爆发到超级应用雏形初现,已逐步渗透至多个场景。本次爱分析邀请网易数智副总经理、网易云信总经理段毓铮与网易云信音视频技术负责人、流媒体首席架构师吴桐在线对谈,深度交流AI技术在企业级场景的实战经验与未来趋势,为泛IT从业者提供前沿洞察与创新启示。
    从生成式到推理模型:AI应用的未来演进与商业机会
  • Oracle 与 NVIDIA 合作助力企业加速代理式 AI 推理
    Oracle 和 NVIDIA 宣布,NVIDIA 加速计算和推理软件与 Oracle 的 AI 基础设施以及生成式 AI 服务首次实现集成,以帮助全球企业组织加速创建代理式 AI 应用。 此次 Oracle Cloud Infrastructure (OCI) 与 NVIDIA AI Enterprise 软件平台之间的集成,将使 160 多个 AI 工具和 100 多个 NVIDIA NIM™
    Oracle 与 NVIDIA 合作助力企业加速代理式 AI 推理

正在努力加载...