扫码加入

CUDA

加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。 开发人员可以使用C语言来为CUDA™架构编写程序,所编写出的程序可以在支持CUDA™的处理器上以超高性能运行。CUDA3.0已经开始支持C++和FORTRAN。

CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。 开发人员可以使用C语言来为CUDA™架构编写程序,所编写出的程序可以在支持CUDA™的处理器上以超高性能运行。CUDA3.0已经开始支持C++和FORTRAN。收起

查看更多
  • GPU不是 NVIDIA 的护城河,CUDA 才是
    CUDA 成为一套被精心构建、并已完成闭环的技术—产业—权力系统,其本质不仅是工具,更是“算力秩序”。CUDA 将算力的使用定义权提升到软件—生态—规则层面,形成了强大的生态系统壁垒。CUDA 的统治稳定,源于规则制定者的地位、既得利益者的依赖以及后来者的挑战难度。真正的代价不仅在于资金,更在于时间和耐心。CUDA 警告我们,算力的选择权一旦丧失,将难以挽回。
    564
    01/27 10:15
    GPU不是 NVIDIA 的护城河,CUDA 才是
  • TPU 的成功,是否正在宣告“GPU + CUDA 时代”的终结?
    文章讨论了GPU和TPU两种计算架构的特点及其在不同场景下的适用性。GPU以其通用性和强大的软件生态系统著称,适用于广泛的应用领域;而TPU则通过垂直整合的方式,在大规模训练和推理方面展现出更高的性能和能效,尤其是在云计算环境中。尽管TPU在某些方面优于GPU,但在通用市场中两者仍会长期共存,形成互补关系。文章最后提出,对于大型云计算环境,垂直整合的TPU架构具有明显的长期竞争优势,而对于普通应用场景,则继续保持GPU的优势地位。
    546
    01/19 10:27
    TPU 的成功,是否正在宣告“GPU + CUDA 时代”的终结?
  • 海光CPU创始人唐志敏:异构计算已成必然,软件决定芯片胜负
    唐志敏教授在第八届GAIR大会上发表主题演讲,探讨了算力在未来十年的关键变量和发展方向。他指出,算力不仅仅是硬件性能的体现,更是资源与时间约束下的任务执行能力。面对生成式AI对算力的高需求,单一CPU已不足以应对,异构计算(CPU+XPU)成为必要选择。他认为,软件和应用生态是决定算力芯片成功的关键因素,而非单纯依靠硬件架构。他还分析了x86、Arm和RISC-V在市场中的现状和挑战,强调了生态惯性和软件兼容性的重要性。此外,唐教授呼吁业界应考虑统一指令系统方向,促进不同类型的处理器在同一架构平台上协同工作,以减少重复投入。
    1012
    2025/12/24
    海光CPU创始人唐志敏:异构计算已成必然,软件决定芯片胜负
  • 智算QA | Triton:用类Python的语法,写出媲美CUDA性能的算子
    「智算QA」是奕行智能新推出的行业对话专栏,每期邀请AI计算领域的技术专家,用尽可能简洁的方式,解读前沿趋势,分享最新实践。 凭借对开发者友好的易用性、高性能和高潜能,Triton日益“走红”,甚至被认为是破局英伟达CUDA生态的技术路径之一。本期智算QA,我们邀请到了AI编译器专家Shawn,分享Triton的生态优势、NPU架构适配等话题,并解读奕行智能的Triton支持与未来布局。 Q1 可
    1835
    2025/12/11
    智算QA | Triton:用类Python的语法,写出媲美CUDA性能的算子
  • 曙光与海光合并终止!算力双龙头剑指开放生态?
    国产算力最大重组案宣布终止。 日前,中科曙光与海光信息同步发布公告,双方宣布正式终止延续近半年的换股吸收合并方案,本次终止不会对双方生产经营及财务状况造成重大不利影响。 公告指出,由于本次交易规模较大、涉及相关方较多,使得重大资产重组方案论证历时较长,目前市场环境较本次交易筹划之初发生较大变化,本次实施重大资产重组的条件尚不成熟,为切实维护上市公司和广大投资者长期利益,经公司与交易各相关方友好协商
  • 英伟达将CUDA移植到RISC-V架构
    2017年,英伟达与上海交通大学联合举办了RISC-V工作坊,这是北美地区以外的首个RISC-V工作坊。当时英伟达的重点是其处理器中的嵌入式MCU,尽管尚未发布具体产品,但已看好其前景。如今,英伟达的集成了RISC-V内核MCU的产品的出货量每年突破10亿颗,这一成绩距离2017年的工作坊已过去八年,验证了当初的判断。
    1108
    2025/07/24
    英伟达将CUDA移植到RISC-V架构
  • RISC-V“芯”趋势
    新兴技术越蓬勃,RISC-V就越繁荣。凭借开放、可定制、可扩展、简洁高效等优势,RISC-V在生成式AI、汽车电子、智能终端等领域加速渗透,以新的逻辑和思路焕新计算产业。同时,随着RVA23的发布,RISC-V的软件生态和跨平台能力持续提升,全产业链加速适配。在7月17日举办的第五届RISC-V中国峰会(以下简称“峰会”)上,记者看到了一系列“芯”趋势。
    RISC-V“芯”趋势
  • 英伟达官宣:CUDA将全面支持RISC-V架构!
    2025年7月17日,2025年RISC-V中国峰会正式在中国上海张江召开。人工智能芯片大厂英伟达(NVIDIA)副总裁 Frans Sijstermanns做了题为《在英伟达计算平台实现RISC-V应用处理器部署》的主题演讲,介绍了英伟达在RISC-V CPU上的发展历程和成果,并宣布其关键的CUDA软件接下来也将支持在RISC-V上的全面部署。
  • Frans Sijstermanns:英伟达正着手将CUDA移植到RISC-V平台
    随着RISC-V生态的成熟,英伟达正着手将CUDA移植到RISC-V平台,这一举措不仅顺应了开源硬件的发展趋势,也为英伟达的加速计算架构开辟了新的可能性。
    1255
    2025/07/17
    Frans Sijstermanns:英伟达正着手将CUDA移植到RISC-V平台
  • RISC-V激辩AI算力未来:架构破局、挑战CUDA、终端AI潜力
    在第五届RISC-V中国峰会的圆桌论坛上,上海开放处理器产业创新中心理事长、峰会主席戴伟民,与12家RISC-V企业技术领袖、学者展开了深度对话,揭示了RISC-V征战AI算力市场的技术路线与生态破局点。 “Baby RISC-V”:颠覆传统控制架构 Tenstorrent 提出的 “Baby RISC-V” 是其自研AI芯片架构中的核心创新之一,这一概念最早公开于 2024年8月发布的Black
    2577
    2025/07/17
  • 深度丨CUDA作为英伟达底层算法平台的核心意义
    CUDA最初是为科学计算领域设计的,英伟达致力于在消费级游戏显卡之外拓展新的市场机遇。借助CUDA的发展,英伟达成功地在数据中心等高性能计算领域找到了第二个增长点。
    1275
    2025/05/08
    深度丨CUDA作为英伟达底层算法平台的核心意义
  • 独家提问黄仁勋:CUDA不会受到开源冲击;英伟达不再是“卖芯片的”,它是全世界的根基
    GTC主题演讲后第二天,我们参加了一场与英伟达创始人兼CEO黄仁勋的对话。他回答了从AI的发展,芯片和数据中心的未来,到中国AI行业竞争力的多个问题。其中,他自己最关心的,是英伟达这家公司的转变。他形容,今年的GTC非常重要,它是一次转折点,不只是英伟达,也是整个行业的转折点。
    559
    2025/03/20
    独家提问黄仁勋:CUDA不会受到开源冲击;英伟达不再是“卖芯片的”,它是全世界的根基
  • 从Tesla到Blackwell,英伟达如何改写HPC规则
    明日,英伟达创始人CEO黄仁勋将迎来重振该公司股价的重要契机。在英伟达年度技术峰会GTC上,黄仁勋将阐述他如何带领英伟达探索AI下一个前沿的方向。据摩根大通此前预计,英伟达将在大会上推出Blackwell Ultra芯片(GB300),并可能披露Rubin平台的部分细节。此次大会还将聚焦AI硬件的全面升级,包括更高性能的GPU、HBM内存、更强的散热和电源管理,以及CPO(共封装光学)技术路线图。
    从Tesla到Blackwell,英伟达如何改写HPC规则
  • jetson中使用cuda
    昨天分享了 cuda在ubuntu的安装和使用,今天在jetson nano上进行测试验证使用cuda。在jetson nano上安装使用cuda和ubuntu有所区别,所以写了这篇文章。
    2175
    2025/03/05
  • cuda在ubuntu的安装使用分享
    之前给大家分享过opencv在jetson nano 2gb和ubuntu设备中使用并且展示了一些人脸识别等的小demo。但是对于图像处理,使用gpu加速是很常见 .(以下概念介绍内容来自百科和网络其他博主文章)
    2123
    2025/03/02
  • 一文了解人工智能(AI)算法及GPU运行原理
    当今,人工智能(Artificial Intelligence)已经深刻改变了人类生活的方方面面,并且在未来仍然会继续发挥越来越重要的影响力。“人工智能”这一概念在1956年于美国达特茅斯学院举办的一次学术集会上被首次提出,自此开启了人工智能研究的新纪元。自此之后,人工智能在曲折中不断发展前进。
  • “DeepSeek甚至绕过了CUDA”,论文细节再引热议,工程师灵魂提问:英伟达护城河还在吗?
    英伟达刚刚从DeepSeek-R1引发的4万亿元暴跌中缓过劲来,又面临新的压力?硬件媒体Tom‘s Hardware带来开年最新热议:DeepSeek甚至绕过了CUDA,使用更底层的编程语言做优化。这一次是DeepSeek-V3论文中的更多细节,被人挖掘出来。
    “DeepSeek甚至绕过了CUDA”,论文细节再引热议,工程师灵魂提问:英伟达护城河还在吗?
  • 海光:x86+类CUDA,双驱并进驶入国产算力黄金年代
    在算力国产化背景下,海光信息作为国内为数不多同时深耕CPU和DCU(GPGPU路线)双赛道的厂商,近几年业绩迎来爆发,营收几乎翻倍增长。
    6102
    2024/09/19
    海光:x86+类CUDA,双驱并进驶入国产算力黄金年代
  • 国产AI芯片厂商如何打破英伟达CUDA生态垄断?
    可否借鉴开源的安卓生态( 多样化的硬件选择、开放源代码的自由度、广泛的应用和服务)或者封闭的iOS生态(高度整合协同的硬件和软件、卓越的用户体验、安全性的保障)的模式,来突破英伟达CUDA生态的封锁呢?
    1837
    2024/08/20
    国产AI芯片厂商如何打破英伟达CUDA生态垄断?

正在努力加载...