FPGA配置要逆天了,还有什么能阻止得了它吗?

2014-05-14 10:09:40 来源:EEFOCUS
标签:

 

Altera发布了业界第一款支持硬核浮点DSPFPGA,硬核浮点DSP模块将集成在Altera 20nm Arria 10 FPGA和SoC中,也会集成在14nm Stratix 10 FPGA和SoC中。这一革命性的设计会对器件浮点运算性能带来多大的提升,对传统FPGA浮点运算设计带来多大的改变,又会对DSP以及GPU市场带来多大的影响,Altera公司首席DSP产品规划经理Michael Parker、软件和DSP产品市场经理Albert Chang先生连线国内媒体,带来了精彩的内容分享。

 

硬核兼容IEEE754,支持单精度浮点运算

支持硬核浮点DSP的FPGA使用专用硬核电路,能够自然支持IEEE 754单精度浮点。IEEE 754浮点所有复数都位于DSP模块的硬核逻辑中,不会占用可编程逻辑,即使是100%的使用了DSP模块,浮点也支持定点设计中相似的时钟速率。

 

采用TSMC 20nm工艺的Arria 10 系列,浮点运算性能将达到1.5TFLOP的DSP性能,而且是单精度。它的运行频率可以达到400到450MHz,在软件方面支持OpenCL、DSP Builder和浮点宏功能。

 

至于1.5TFLOP的浮点运算是如何计算出的,笔者也作了详细的了解:Arria 10器件10AX066含有660 kLE的逻辑,以及1688个DSP模块,总共有1688个浮点加法器和1688个浮点乘法器。运行在450 MHz的总计3376个浮点运算器性能达到了1520 GFLOPS。德州仪器、Nvidia和AMD也都是采用这一峰值浮点性能判定方法计算其DSP和GPU的峰值GFLOPS的。

 

而采用Intel 14nm三栅极工艺制成的高端FPGA和SOC Stratix 10系列单精度浮点运算可以达到10TFLOP的水平。

 

浮点模块与现有设计是后向兼容,对定点性能没有影响。DSP设计人员可以选择定点或者浮点模式,每一个DSP模块都可以独立运行。

 

极大提高设计效能及资源使用效率

加入硬核浮点模块带来的提升是巨大的,它极大的提高了设计人员的效能,也释放了FPGA的逻辑资源,使其可以供其他任务使用,为设计产品的迅速面市提供了可靠保障。

 

 
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
 

 

作者简介
岳浩
岳浩

与非网记者。8年研发工程师背景,常驻苏州,喜交友。闲时喝喝茶,侃大山;忙时到处跑,找新闻。希望我们的努力对您有所帮助! 邮箱:yuehao@eefocus.com 欢迎与我联系!

继续阅读
从FPGA到ACAP,“万能芯片” 的华丽转身
从FPGA到ACAP,“万能芯片” 的华丽转身

FPGA被誉为“万能芯片”,能量就只有这么一点?当然不是的,目前FPGA在数据中心领域已经得到认可,加速卡解决方案成为数据中心的首选。而人工智能通过深度学习算法在认知智能和推理智能上遇到难题,擅长推理的FPGA被寄予厚望。

基于SRAM工艺FPGA的保密性问题

在现代电子系统设计中,由于可编程逻辑器件的卓越性能、灵活方便的可升级特性,而得到了广泛的应用。

如果使用FPGA配合DSP来提升安全能力?

对于基于数字信号处理器(DSP)的设计,如果DSP没有足够的安全能力,便特别容易受到入侵。在许多应用中,如果使用FPGA以作配合来卸载DSP的部分工作,便可以轻易实施先进的安全功能。

详细分析CORDIC算法的原理及其FPGA实现方法

在无线电接收机系统中,由于会受到发射机运动、接收机运动和标准频率随时间动态变化等因素的影响,其接收机接收信号往往会发生频率偏移,因而需要进行频偏校正。在扩频通信系统中,频偏校正电路能消除中频偏移对接收机扩频码的捕获以及数据解调性能的影响,从而提高接收机的性能。

SM3算法简介和SM3算法的FPGA设计与实现

在分析SM3算法的基础上详细介绍了目前Hash函数的4种硬件实现策略,同时给出了迭代方式和基于充分利用时钟周期的循环展开方式下的FPGA实现。该循环展开方式有效地减少了一半的工作时钟数和11%的运算时间,吞吐量提高了11%,且占用的硬件资源较少。

更多资讯
《深度强化学习》手稿开放

一年前,机器之心发布了加拿大阿尔伯塔大学计算机系博士 Yuxi Li 的深度强化学习综述论文,该论文概述了在深度强化学习(Deep Reinforcement Learning)方面喜人的进展。而这本刚上线的《深度强化学习》手稿对前面的版本《深度强化学习综述》做了大规模的改进;从一年多前的 70 页扩充到现在的 150 页。

GICv3架构中,对中断的分组解析

GICv3架构中,对中断进行了分组。分成了以下三个组

想要学好大数据需掌握这十二大技术

大数据是对海量数据进行存储、计算、统计、分析处理的一系列处理手段,处理的数据量通常是TB级,甚至是PB或EB级的数据,这是传统数据处理手段所无法完成的,其涉及的技术有分布式计算、高并发处理、高可用处理、集群、实时性计算等,汇集了当前IT领域热门流行的IT技术。

35岁咋就成了某些工程师的坎儿?

在工程师这个“贵圈”有个不成文的观念,据说,如果过了35岁,还在吭哧吭哧地干技术,那就是人生的loser,以激进著称的华为甚至也貌似传出过淘汰34岁以上工程师的流言。本来嘛,靠着在百家讲坛上讲三国还清房贷并成功逆袭人生的易中天教授就曾经提到过,‘古人三十六岁就自称老夫’,按古人虚岁方式计算,现如今的35岁正好是古人的36岁。一位“老夫”,

C语言嵌入式系统编程

模块划分的"划"是规划的意思,意指怎样合理的将一个很大的软件划分为一系列功能独立的部分合作完成系统的需求。C语言作为一种结构化的程序设计语言,在模块的划分上主要依据功能(依功能进行划分在面向对象设计中成为一个错误,牛顿定律遇到了>相对论), C语言模块化程序设计需理解如下概念

Moore8直播课堂