2023年GPU行业深度研究 GPU相较于CPU并行计算能力更强.docx

2023年GPU行业深度研究 GPU相较于CPU并行计算能力更强.docx

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
2023年GPU行业深度研究 GPU相较于CPU并行计算能力更强 GPU芯片概述 GPU定义和主要组成 GPU(Graphics Processing Unit):一般称为图形处理器,被广泛用于个人电脑、工作站、移动设备、游戏机、嵌入式 系统中做图像和图形相关运算工作。 GPU结构:GPU是一个异构的多核处理器芯片,针对图形图像处理优化。通常包括运算单元、L0/L1/L2缓存、Warp调度器、 存取单元、分配单元、寄存器堆、PCIe总线接口、显卡互联单元等组件。 GPU工作方式:GPU并不是一个独立运行的计算平台,需要通过PCIe总线与CPU连接在一起来协同工作,可以看作CPU的协处 理器。 GPU相较于CPU并行计算能力更强 CPU当中运算单元占据面积相对较小。CPU硬件设计过程中为了实现低延迟增加了存储单元和控制单元的复杂度,运算单元 在GPU中占据面积相对较小,以Intel Core i7 3960X为例,其运算单元面积(6*21.4 mm2)大致占总芯片面积(435 mm2) 的30%。 CPU的并行计算能力相对较弱。CPU通过指令级并行、数据级并行也可以提升其并行计算能力,但是带来的提升也是有限的。 单核CPU性能逐步逼近物理极限。由于CPU受到“能耗墙”的限制,CPU主频难以持续提升,单核CPU性能逐步逼近物理极限, 采用多核CPU的策略一定程度缓解了CPU性能提升的制约,当前大数据和人工智能带来了海量的数据,CPU已经无法跟上多 源异构数据的爆炸性增长。 GPU具有数量众多的运算单元,采用极简的流水线进行设计,适合计算密集、易于并行的程序。CPU的运算单元数目相对较 少,单一运算核心的运算能力更强,采用分支预测、寄存器重命名、乱序执行等复杂的处理器设计,适合相对复杂的串行 运算。 GPU设计过程中侧重吞吐优化,具备强大的内存访问带宽。CPU设计过程中侧重时延优化,包含复杂的多级缓存(L1/L2/L3) 和逻辑控制单元。 CPU承担运算核心和控制中心的地位,GPU一般作为协处理器负责图形渲染和并行计算。 GPU的核心功能一:图形渲染 GPU凭借其较强的并行计算能力,已经成为个人电脑中图像渲染的专用处理器。 图形渲染具体实现要通过五阶段:顶点着色、形状装配、光栅化、纹理填充着色、测试与混合。 GPU渲染流程:三维图像信息输入GPU后,读取3D图形外观的顶点数据后,1)在流处理器中构建3D图形的的整体骨架,即 顶点处理;2)由光栅化处理单元把矢量图形转化为一系列像素点,即光栅化操作;3)在纹理映射单元实现纹理填充;4) 在流处理器中完成对像素的计算和处理,即着色处理;5)在光栅化处理单元中实现测试与混合任务。至此,实现一个完 整的GPU渲染流程。 GPU的核心功能二:通用计算 2003年,GPGPU(General Purpose computing on GPU, 基于GPU的通用计算)的概念首次被提出,意指利用GPU的计算能力 在非图形处理领域进行更通用、更广泛的科学计算。GPGPU概念的提出,为GPU更为广泛的应用开拓了思路,GPGPU在传统 GPU的基础上进行了优化设计,部分GPGPU会去除GPU中负责图形处理加速的硬件组成,使之更适合高性能并行计算。 GPGPU在数据中心被广泛地应用在人工智能和高性能计算、数据分析等领域。GPGPU的并行处理结构非常适合人工智能计算, 人工智能计算精度需求往往不高,INT8、FP16、FP32往往可以满足大部分人工智能计算。GPGPU同时可以提供FP64的高精 度计算,使得GPGPU适合信号处理、三维医学成像、雷达成像等高性能计算场景。 微架构设计是GPU性能提升的关键所在 GPU微架构(Micro Architecture)是兼容特定指令集的物理电路构成,由流处理器、纹理映射单元、光栅化处理单元、 光线追踪核心、张量核心、缓存等部件共同组成。图形渲染过程中的图形函数主要用于绘制各种图形及像素、实现光影处 理、3D坐标变换等过程,期间涉及大量同类型数据(如图像矩阵)的密集、独立的数值计算,而GPU结构中众多重复的计 算单元就是为适应于此类特点的数据运算而设计的。微架构的设计对GPU性能的提升发挥着至关重要的作用,也是GPU研发过程中最关键的技术壁垒。微架构设计影响到芯片的 最高频率、一定频率下的运算能力、一定工艺下的能耗水平,是芯片设计的灵魂所在。英伟达H100相比于A100,1.2倍的 性能提升来自于核心数目的提升,5.2倍的性能提升来自于微架构的设计。 GPU市场概述 GPU市场规模与细分 根据Verified Market Research的预测,2020年GPU全球市场规模为254亿美金,预计到2028年将达到2465亿美金,行业保 持高速增长,CAGR为32.9%,

您可能关注的文档

文档评论(0)

小鱼X + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

认证主体周**

1亿VIP精品文档免费下

相关文档

相关课程推荐