GPU和FPGA优缺点的对比详细概述你现在要开始了解FPGA了

FPGA极客空间 2018-06-10 11:44 次阅读

GPU和FPGA优缺点的对比详细概述你现在要开始了解FPGA了

我知道,我对与管家婆生活幽默有关的所有事情都很着迷,但不论从哪个角度看,今天的现场可编程门阵列(FPGA),都显得“鹤立鸡群”,真是非常棒的器件。如果在这个智能时代,在这个领域,想拥有一技之长的你还没有关注FPGA,那么世界将抛弃你,时代将抛弃你。

从几个方面来介绍一下GPU和FPGA。

从峰值性能来说,GPU(10Tflops)远远高于FPGA(<1TFlops)。GPU上面成千上万个core同时跑在GHz的频率上还是非常壮观的,最新的GPU峰值性能可达10TFlops以上。GPU的架构经过仔细设计(例如使用深度流水线,retiming等技巧),在电路实现上是基于标准单元库而在critical path上可以用手工定制电路,甚至在必要的情形下可以让半导体fab依据设计需求微调工艺制程,因此可以让许多core同时跑在非常高的频率。相对而言,FPGA首先设计资源受到很大的限制,例如GPU如果想多加几个core只要增加芯片面积就行,但FPGA一旦你型号选定了逻辑资源上限就确定了(浮点运算在FPGA里会占用很多资源)。而且,FPGA里面的逻辑单元是基于SRAM-查找表,其性能会比GPU里面的标准逻辑单元差好多。最后,FPGA的布线资源也受限制(有些线必须要绕很远),不像GPU这样走ASIC flow可以随意布线,这也会限制性能。

除了芯片性能外,GPU相对于FPGA还有一个优势就是内存接口。GPU的内存接口(传统的GDDR,最近更是用上了HBM和HBM2)的带宽远好于FPGA的传统DDR接口,而众所周知服务器端机器学习算法需要频繁访问内存。

GPU和FPGA优缺点的对比详细概述你现在要开始了解FPGA了

但是从灵活性来说,FPGA远好于GPU。FPGA可以根据特定的应用去编程硬件(例如如果应用里面的加法运算非常多就可以把大量的逻辑资源去实现加法器),但是GPU一旦设计完那就没法改动了,没法根据应用去调整硬件资源。目前机器学习大多数适合使用SIMD架构(即只需一条指令可以平行处理大量数据),因此用GPU很适合。但是有些应用是MISD(即单一数据需要用许多条指令平行处理,微软在2014年ISCA paper里面就举了一个MISD用于并行提取feature的例子),这种情况下用FPGA做一个MISD的架构就会比GPU有优势。不过FPGA的编程对于程序员来说并不容易,所以为了能让机器学习程序员能方便地使用FPGA往往还需要在FPGA公司提供的编译器基础上进行二次开发,这些都是只有大公司才能做。

FPGA实现的机器学习加速器在架构上可以根据特定应用优化所以比GPU有优势,但是GPU的运行速度(>1GHz)相比FPGA有优势(~200MHz)。

GPU和FPGA优缺点的对比详细概述你现在要开始了解FPGA了

所以,对于平均性能,看的就是FPGA加速器架构上的优势是否能弥补运行速度上的劣势。如果FPGA上的架构优化可以带来相比GPU架构两到三个数量级的优势,那么FPGA在平均性能上会好于GPU。例如,百度在HotChips上发布的paper显示,GPU的平均性能相比FPGA在矩阵运算等标准batch data SIMD bench上远好于FPGA;但是在处理服务器端的少量多次处理请求(即频繁请求但每次请求的数据量和计算量都不大)的场合下,平均性能会比GPU更好。

GPU和FPGA优缺点的对比详细概述你现在要开始了解FPGA了

功耗方面,虽然GPU的功耗(200W)远大于FPGA的功耗(10W),但是如果要比较功耗应该比较在执行效率相同时需要的功耗。如果FPGA的架构优化能做到很好以致于一块FPGA的平均性能能接近一块GPU,那么FPGA方案的总功耗远小于GPU,散热问题可以大大减轻。反之,如果需要二十块FPGA才能实现一块GPU的平均性能,那么FPGA在功耗方面并没有优势。

能效比的比较也是类似,能效指的是完成程序执行消耗的能量,而能量消耗等于功耗乘以程序执行的时间。虽然GPU的功耗远大于FPGA的功耗,但是如果FPGA执行相同程序需要的时间比GPU长几十倍,那FPGA在能效比上就没有优势了;反之如果FPGA上实现的硬件架构优化得很适合特定的机器学习应用,执行算法所需的时间仅仅是GPU的几倍或甚至于接近GPU,那么FPGA的能效比就会比GPU强。

热门推荐

原文标题:谈谈GPU与FPGA的一些看法

文章出处:【微信号:ALIFPGA,微信公众号:FPGA极客空间】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

英伟达公司近年股价走势,人工智能芯片初创公司数量爆炸式增长

近年所有的目光都集中在了Nvidia上,因为它的显卡和GPU在很多方面都有巨大的市场需求:如游戏,数....

的头像 ssdfans 发表于 07-17 14:22 122次 阅读
英伟达公司近年股价走势,人工智能芯片初创公司数量爆炸式增长

主动脉夹层分割深度学习模型是如何炼成的?

利用深度学习进行主动脉真假腔分割有赖于大量手动标注的主动脉图像来训练深度学习网络,计算量大,且对计算....

的头像 英伟达NVIDIA中国 发表于 07-17 09:14 281次 阅读
主动脉夹层分割深度学习模型是如何炼成的?

高速数据转换器实现方案中使用LVDS的应用诀窍和技巧

采用单端CMOS数字信号时,逻辑电平以大约1 V/nS的速度移动,典型输出负载为10 pF(最大值)....

的头像 管家婆生活幽默工程专辑 发表于 07-17 08:41 138次 阅读
高速数据转换器实现方案中使用LVDS的应用诀窍和技巧

学好FPGA,轻松快速实现工程梦

发表于 07-16 16:36 127次 阅读
学好FPGA,轻松快速实现工程梦

为FPGA 设计电源管理,有几点要素要牢记!

发表于 07-16 16:02 154次 阅读
为FPGA 设计电源管理,有几点要素要牢记!

华为亮相CES Asia,揽获三项最佳奖项

华为终端AR&VR产品线总裁李腾跃出席会议并发表了主题为《大时代,大机遇,大挑战》的演讲。他表示:“....

的头像 华为终端 发表于 07-16 11:13 329次 阅读
华为亮相CES Asia,揽获三项最佳奖项

低功耗目标检测系统设计挑战赛:中科院、清华分获GPU与FPGA组冠军

与传统的物体检测不一样,本次比赛需要参赛队伍检测同一个物体。在无人机跟随应用中,无人机需要准确地检测....

的头像 智车科技 发表于 07-16 10:36 434次 阅读
低功耗目标检测系统设计挑战赛:中科院、清华分获GPU与FPGA组冠军

自制CPU(一)单周期

设计是基于MIPS指令集的单周期,多周期,流水线CPU。最终实现也是在FPGA板上跑了一个小程序,开....

的头像 学FPGA,慢慢来 发表于 07-16 09:20 99次 阅读
自制CPU(一)单周期

自制CPU(二)多周期

接上次,我们简单的说了一下单周期的理解,下面我们说一下多周期。单周期每一条指令都是一个时钟周期结束。....

的头像 学FPGA,慢慢来 发表于 07-16 09:20 102次 阅读
自制CPU(二)多周期

自制CPU(三)流水线

经过上两篇文章的阅读,大家应该清楚自己的CPU大致是如何处理数据的,而又是如何执行指令的。我们现在来....

的头像 学FPGA,慢慢来 发表于 07-16 09:20 87次 阅读
自制CPU(三)流水线

自制CPU(四)程序编写

在我们设计出来前边三种CPU之后,我们来进行程序的编写。 所谓程序的编写,就是;利用我们写好的CPU....

的头像 学FPGA,慢慢来 发表于 07-16 09:20 256次 阅读
自制CPU(四)程序编写

PYNQ 基于Zynq架构添加了对python的支持

PYNQ全称为Python Productivity for Zynq,即在原有Zynq架构的基础上....

发表于 07-14 09:05 74次 阅读
PYNQ 基于Zynq架构添加了对python的支持

基于FPGA的简单图像处理程序,可实现两个功能

首先编写相应的C/C++语言程序,加入到Vivado HLS工程中,再编写相应的testbench代....

发表于 07-14 08:56 93次 阅读
基于FPGA的简单图像处理程序,可实现两个功能

FPGA的两种处理器中断模式

边沿触发用的很少,一般还是以下降沿触发为主。当设备完成一个数据后,会输出一个下降沿,触发处理器。而电....

发表于 07-14 08:30 64次 阅读
FPGA的两种处理器中断模式

关于FPGA芯片的故事,你知道多少呢?

除了CPU(中央处理)和GPU(图形处理器)之外,芯片家族还有另外一名“成员”—FPGA。

发表于 07-13 15:20 142次 阅读
关于FPGA芯片的故事,你知道多少呢?

使用 DSP+ARM SoC 的优化雷达系统物料清单/参考指南及应用手册下载

发表于 07-13 12:05 6次 阅读
使用 DSP+ARM SoC 的优化雷达系统物料清单/参考指南及应用手册下载

Xilinx Kintex UltraScale XCKU040 FPGA 电源解决方案PMP10630技术资料下载

发表于 07-13 11:33 10次 阅读
Xilinx Kintex UltraScale XCKU040 FPGA 电源解决方案PMP10630技术资料下载

关于FPGA的{12 - color_width{1'b0}} 是什么意思?

发表于 07-12 18:49 117次 阅读
关于FPGA的{12 - color_width{1'b0}} 是什么意思?

基于FPGA的无线视频技术应用解决方案详解

数字视频技术是当今消费市场上最令人激动的一个亮点,而无线技术能够确保数据的加密并逐渐支持更高的数据....

发表于 07-12 16:00 63次 阅读
基于FPGA的无线视频技术应用解决方案详解

FPGA码代码非常好用的编辑软件-Gvim

发表于 07-12 15:20 138次 阅读
FPGA码代码非常好用的编辑软件-Gvim

盘点人工智能产业链的三个核心相关公司

2020年全球人工智能市场规模约1190亿人民币,未来10年,人工智能将会是一个2000亿美元的市场....

的头像 物联网资本论 发表于 07-12 14:37 1340次 阅读
盘点人工智能产业链的三个核心相关公司

Virtex-6 ml605以太网接口问题

发表于 07-12 11:21 161次 阅读
Virtex-6 ml605以太网接口问题

FPGA常用设计思想与技巧

两种不推荐的异步时钟域操作方法:一种是通过增加Buffer或者其他门延时来调整采样;另一种是盲目使用....

的头像 FPGA极客空间 发表于 07-12 09:33 1283次 阅读
FPGA常用设计思想与技巧

Mellanox网卡嵌入Xilinx FPGA,能实现网络功能提速

在线路内对冲场景下,来自以太网接口的流量将被传递至FPGA以实现网络分流,而后被交付至Connect....

发表于 07-12 08:38 51次 阅读
Mellanox网卡嵌入Xilinx FPGA,能实现网络功能提速

有关FPGA的配置的问题?

发表于 07-11 23:35 172次 阅读
有关FPGA的配置的问题?

华为发布GPU Turbo图形加速技术,竟被腾讯一次游戏更新侧翻

在更新腾讯游戏《绝地求生刺激战场》激情一夏新版本后,不少使用搭载GPU Turbo图形加速技术的华为....

发表于 07-11 17:51 392次 阅读
华为发布GPU Turbo图形加速技术,竟被腾讯一次游戏更新侧翻

高云半导体广州总部启用暨校企合作研讨会

广东高云半导体科技股份有限公司(以下简称“高云半导体”)于7月10日在广州科学城总部经济区科学大道2....

的头像 人间烟火123 发表于 07-11 16:53 1146次 阅读
高云半导体广州总部启用暨校企合作研讨会

GPU虚拟化三位一体推动IT设计平台革新

首先,通过实施应用虚拟化、桌面虚拟化、GPU虚拟化,安全打通研发与办公网连接,解决了研发网用户浏览互....

的头像 英伟达NVIDIA企业解决方案 发表于 07-11 16:18 505次 阅读
GPU虚拟化三位一体推动IT设计平台革新

智能FPGA芯片让“中国芯”在世界舞台大放异彩,引领世界“芯”未来

据了解,贾红的爷爷是一位革命烈士,曾跟随刘志丹等革命前辈抛头颅,洒热血,为中国的革命事业献出了他宝贵....

的头像 芯师爷 发表于 07-11 15:57 410次 阅读
智能FPGA芯片让“中国芯”在世界舞台大放异彩,引领世界“芯”未来

最新款GPU驱动型超级计算机加速各类科学研究

作为目前世界上运行速度最快的超级计算机,Summit在距其初次亮相数周后就已经凭借其迅猛的性能为各个....

的头像 英伟达NVIDIA中国 发表于 07-11 15:01 238次 阅读
最新款GPU驱动型超级计算机加速各类科学研究

PowerVR的开发者技术支持团队在GDC 2018都展现了什么

PVRStudio ——一款2018年全新的工具,它是一个功能齐全的IDE,世界上第一款移动/嵌入式....

发表于 07-11 14:55 92次 阅读
PowerVR的开发者技术支持团队在GDC 2018都展现了什么

常用于3个电源的加电和断电排序

发表于 07-11 10:23 303次 阅读
常用于3个电源的加电和断电排序

基于FPGA实现数字控制技术的程控直流变换器设计

传统变换器采用模拟硬件实现闭环反馈控制,获得稳定的电压和电流输出。模拟控制实时反应系统状态,响应速度....

发表于 07-11 08:40 76次 阅读
基于FPGA实现数字控制技术的程控直流变换器设计

Xilinx FPGA在基因组测序中的优势

PrecisionFDA平台是基因组信息学社区和共享数据平台,这是一个为研究人员准备的开源、基于云的....

发表于 07-11 08:33 84次 阅读
Xilinx FPGA在基因组测序中的优势

菲数科技以“FPGA+云”助力高性能计算

随着通用处理器(CPU)的摩尔定律已入暮年,从美国的微软、亚马逊到中国的BAT、华为,几乎所有的互联....

的头像 FPGA极客空间 发表于 07-10 16:56 1312次 阅读
菲数科技以“FPGA+云”助力高性能计算

机器学习正处于经典过热期的顶端

另一位发言者是Dean Kamen,他是DEKA研发中心的创始人,他指出人们对物联网隐私问题以及智能....

的头像 Imagination Tech 发表于 07-10 16:56 207次 阅读
机器学习正处于经典过热期的顶端

xilinx FFT ip核仿真的误差太大?

发表于 07-10 16:16 183次 阅读
xilinx FFT ip核仿真的误差太大?

周正宁:WebRTC+AV1将会是未来技术的风向标

在WebRTCon 2018期间,Aupera CTO周正宁接受了LiveVideoStack的专访....

的头像 LiveVideoStack 发表于 07-10 15:29 193次 阅读
周正宁:WebRTC+AV1将会是未来技术的风向标

NVIDIA 通过GPU实现“时光缓流”,助力登革热攀登科研高峰

登革热俗称“断骨热”,是由登革热病毒引起的疾病。不仅病如其名,令人痛苦不堪,而且每年有数亿人患病,年....

的头像 英伟达NVIDIA企业解决方案 发表于 07-09 16:56 242次 阅读
NVIDIA 通过GPU实现“时光缓流”,助力登革热攀登科研高峰

NVIDIA虚拟GPU技术:用户将享受来自“云端”的极致体验

NVIDIA虚拟GPU业务副总裁John Fanelli近期接受采访时介绍NVIDIA的虚拟GPU技....

的头像 英伟达NVIDIA企业解决方案 发表于 07-09 15:44 195次 阅读
NVIDIA虚拟GPU技术:用户将享受来自“云端”的极致体验

FPGA的原型介绍

原型设计不是一个按几个按钮就能完成的过程,在它不同的阶段需要仔细的关注和思考。除说明这个过程需要完成....

发表于 07-09 15:11 73次 阅读
FPGA的原型介绍

华为云携手峰科发布FPGA基因加速云解决方案,基因测序性能提升5倍

为了更好的解决基因测序行业面临的基因组分析标准流程不经济高效,以及跨不同云和硬件(CPUs,FPGA....

发表于 07-09 14:14 81次 阅读
华为云携手峰科发布FPGA基因加速云解决方案,基因测序性能提升5倍

FPGA为什么会成为嵌入式系统设计的主流选择

随着消费管家婆生活幽默、物联网等领域的不断发展,用户需求也越来越复杂和多样,因此我们在嵌入式系统设计中必须选择....

发表于 07-09 14:04 98次 阅读
FPGA为什么会成为嵌入式系统设计的主流选择

采用Artix-7 XCA75T FPGA的高速多通道数字转换器

Spectrum Instrumentation公司推出了一款新的基于M2p 平台以及59xx模块的....

发表于 07-09 14:02 40次 阅读
采用Artix-7 XCA75T FPGA的高速多通道数字转换器

被zynq的GPIO唬住,告诉你zynq的3种GPIO

我们先看有哪三种GPIO:MIO、EMIO、AXI_GPIO。其中MIO和EMIO是直接挂在PS上的....

发表于 07-07 08:23 99次 阅读
被zynq的GPIO唬住,告诉你zynq的3种GPIO

FPGA与ASIC在打一场围绕成本、功耗和性能的硬仗

随着高通、TI、瑞萨、NXP等汽车管家婆生活幽默巨头均在2014年前后着手研发基于深度学习的处理器单元,他们普....

的头像 高工智能汽车 发表于 07-06 15:37 257次 阅读
FPGA与ASIC在打一场围绕成本、功耗和性能的硬仗

持续满帧60!加持GPU Turbo的华为P20 Pro玩游戏更畅快

自从华为对外宣布GPUTurbo这项新技术之后,广大花粉用户都在热切盼望着升级时刻的到来。对于手上这....

发表于 07-06 14:30 156次 阅读
持续满帧60!加持GPU Turbo的华为P20 Pro玩游戏更畅快

华为的移动影像光学蓝图:让拍照“见所未见”

俗话说“眼见为凭”,未来移动影像新时代,很可能被“见所未见”全新影像体验所彻底推翻!

的头像 DIGITIMES 发表于 07-06 11:37 756次 阅读
华为的移动影像光学蓝图:让拍照“见所未见”

异构计算的软硬件分割没有最好,只有更好的详细资料概述

可以看出,一次旅行,其实结合了各种交通工具的优点。随着摩尔定律的失效和CPU在AI等并行计算方面的缺....

的头像 ssdfans 发表于 07-06 11:00 583次 阅读
异构计算的软硬件分割没有最好,只有更好的详细资料概述

FPGA在AI芯片竞赛中处于什么位置?

人工智能(AI)处理器和支持AI的SoC目前正受到投资界的全面关注,因为他们被视为新兴高度自动化车辆....

的头像 CINNO 发表于 07-06 10:03 426次 阅读
FPGA在AI芯片竞赛中处于什么位置?

如何看待Lattice并购案,根据3大点来看我国FPGA发展路径

FPGA作为通信、航天、军工等领域的关键核心器件,是保障国家战略安全的重要支撑基础。近年来,随着数字....

的头像 FPGA极客空间 发表于 07-06 08:47 1337次 阅读
如何看待Lattice并购案,根据3大点来看我国FPGA发展路径

“FPGA+云"如何提高性能计算“FPGA+云"与“FPGA+端"的详细对比

我知道,我对与管家婆生活幽默有关的所有事情都很着迷,但不论从哪个角度看,今天的现场可编程门阵列(FPGA),都....

的头像 FPGA极客空间 发表于 07-06 08:42 1074次 阅读
“FPGA+云"如何提高性能计算“FPGA+云"与“FPGA+端"的详细对比

基于FPGA加速vBRAS解决方案,三家公司联合发布

据称,本次三家联合发布的解决方案是业界首个在电信云中采用FPGA完成商用级vBRAS数据面调度加速的....

发表于 07-06 08:30 86次 阅读
基于FPGA加速vBRAS解决方案,三家公司联合发布

7月5日速度升级GPU Turbo,让你的华为P20更加流畅

最近在手机圈中最热的话题应该就是华为的GPU Turbo技术,万众期待之中,华为P20系列正式于7月....

发表于 07-05 17:06 162次 阅读
7月5日速度升级GPU Turbo,让你的华为P20更加流畅

数据传输差异的处理

由于数据传输的差异,测试pattern生成的眼图并不一定会是从一个完整的眼图起始。因此,如果采用第一....

的头像 FPGA极客空间 发表于 07-05 15:25 239次 阅读
数据传输差异的处理

FPGA的电源电压种类,你知道多少?

在硬件电路设计中,每一个IC芯片都有相应的电源端口对其供电,以驱动IC进行工作。对于普通的IC芯片,....

发表于 07-05 08:33 151次 阅读
FPGA的电源电压种类,你知道多少?

Altium Designer的发展历史和详细介绍及安装和使用的概述

Altium Designer系统是Altium公司于2006年年初推出的一种管家婆生活幽默设计自动化(Ele....

发表于 07-05 08:00 106次 阅读
Altium Designer的发展历史和详细介绍及安装和使用的概述

GPU如何引爆AI时代

NVIDIA首席科学家Bill Dally在最新一期AI播客中与主持人Noah Kravitz分享了....

的头像 英伟达NVIDIA中国 发表于 07-04 14:31 412次 阅读
GPU如何引爆AI时代