LPU

加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

LPU,全称 Language Processing Unitix,是一种专门为语言处理任务设计的硬件处理器。

LPU,全称 Language Processing Unitix,是一种专门为语言处理任务设计的硬件处理器。收起

查看更多
  • 为什么AI需要专门的硬件加速?从GPU,TPU到LPU的技术演进全景
    AI硬件加速的原因在于神经网络计算的特点:计算密度高、并行性强且控制逻辑简单。GPU因其SIMT执行模型、深多线程隐藏延迟和成熟软件生态成为当前事实标准。TPU/NPU和ASIC分别针对特定场景优化,而FPGA具有可重构特性,适合边缘推理和快速架构实验。LPU专为大模型推理服务设计,注重内存管理和延迟。未来AI硬件的发展趋势包括内存瓶颈、软硬协同设计和场景专业化。
    1661
    05/04 08:55
    为什么AI需要专门的硬件加速?从GPU,TPU到LPU的技术演进全景
  • GPU和LPU,谁才是AI“最优解”?读完这篇你也能说清
    AI芯片领域,英伟达GPU占据主导,但LPU作为专为大语言模型处理(LLM)设计的新架构,已经展现出其独特优势。GPU凭借广泛的应用和强大的通用计算能力,在多个AI任务中表现出色,而LPU则在LLM推理领域具有显著优势,尤其是在低延迟和高吞吐量方面。两者各有侧重,适用于不同应用场景。随着AI技术的发展,未来的AI算力可能会呈现出多样化和专业化的特点,不同任务使用最适合的硬件将成为趋势。
    1404
    04/10 10:24
    GPU和LPU,谁才是AI“最优解”?读完这篇你也能说清
  • 功耗只有284mW的LPU,能跑大模型的吗?
    韩国公司推出一款名为LPU的AI推理芯片,采用4nm工艺,面积仅0.824平方毫米,功耗仅为284毫瓦。该芯片在LLM推理方面表现出色,处理能力远超NVIDIA H100,能效比H100高出33%。其独特架构包括优化的内存访问、智能数据调度、高效的计算引擎和扩展同步链接,使其在大规模模型推理中具有显著优势。尽管仍处于原型阶段,但LPU展示了专用AI芯片在特定领域的巨大潜力,并可能推动端侧推理AI芯片的发展。
    747
    04/02 11:02
    功耗只有284mW的LPU,能跑大模型的吗?
  • 引入LPU的英伟达,是在补强,还是在拆自己的护城河?
    GTC 2026落幕,英伟达宣布与AWS达成大规模芯片采购协议,预计2027年前完成交付。黄仁勋在会上提及的万亿美元营收目标正逐渐变为现实。值得注意的是,Groq芯片首次进入AWS数据中心,引发业界关注。三位半导体与AI算力领域专家讨论了LPU背后的经济与物理瓶颈,以及英伟达在推理时代的策略。他们认为,尽管LPU带来了变革,但其价值还需进一步评估。此外,英伟达持续加码整机柜算力,意图巩固客户心智地位。在软件方面,英伟达推出了NemoClaw软件栈,配套开源模型,展示了其在软件方面的领先地位。最后,几位嘉宾对未来国产算力产业链的发展提出了见解,强调了强链主的重要性以及对顶尖人才的重视。
    860
    04/01 17:19
    引入LPU的英伟达,是在补强,还是在拆自己的护城河?
  • 深度拆解Groq LPU架构:这颗让英伟达花200亿买下的芯片,到底凭什么?
    Groq的TSP架构通过功能分片和流编程模型实现了单批次推理的显著加速,相比传统架构提高了4倍的性能,同时降低了延迟。该架构摒弃了缓存和动态调度,采用确定性路径和静态调度,使得延迟更加可控,特别适合在线部署场景。
    1527
    03/30 09:28
    深度拆解Groq LPU架构:这颗让英伟达花200亿买下的芯片,到底凭什么?