一、图灵和安培架构详细区别对比
架构 | Ampere | Turing |
制造商 | 英伟达 | 英伟达 |
制造工艺 | 8nm(三星) | 12纳米(台积电) |
CUDA 版本 | 8 | 7.5 |
RT 核心 | 第二代 | 第一代 |
张量核心 | 第三代 | 第二代 |
流式多处理器 | 2x FP32 | 1x FP32 |
DLSS | DLSS 2.0 | DLSS 1.0 |
内存支持 | HBM2、GDDR6X | GDDR6、GDDR5、HBM2 |
PCIe 支持 | PCIe 第 4 代 | PCIe 第 3 代 |
NVIDIA 编码器 (NVENC) | 第 7 代 | 第 7 代 |
英伟达解码器 (NVDEC) | 第 5 代 | 第 4 代 |
DirectX 12 | 支持 | 支持 |
虚拟现实 | 支持 | 支持 |
多 GPU 支持 | NVLink 3.0 | NVLink 2.0 |
电源效率 | 比图灵好 | 比伏特好 |
视频输出 | HDMI 2.1,显示端口 1.4a | HDMI 2.0b,显示端口 1.4a |
显卡 | RTX 30 系列 | RTX 20 系列、GTX 16 系列 |
应用 | 游戏、工作站、人工智能 (AI) | 游戏、工作站、人工智能 (AI) |
二、图灵GPU架构
图灵是Volta架构的直接继承者。该架构基于12nm制造工艺,支持GDDR5、HBM2和GDDR6线程。图灵架构在单个GPU芯片中包含CUDA Cores、RTC ores和Tensor Cores(GTX16系列卡除外)。它是第一个支持实时光线追踪的架构,用于创建逼真的图像、阴影、反射和其他高级照明效果。此外,Turing架构还支持DLSS(深度学习超级采样),这是一种基于AI的技术,利用Tensor Core提高游戏的帧数,而不会影响图像或图形质量。但需要注意的是,要利用这两种技术,游戏本身必须光线追踪和DLSS。Turing架构比旧的Pascal架构提供高达6倍的性能提升,这是一个巨大的飞跃。
基于Turing架构的显卡包括GeForce RTX20系列和GTX16系列。但是GTX16系列显卡不带RT Cores和Tensor Cores。RTX20系列显卡还通过USB Type-C连接器支持VirtualLink,以便在USB Type-C端口上连接下一代VR耳机,从而获得令人惊叹的VR体验。Turing架构也用于工作站显卡,包括Quadro RTX4000、Quadro RTX5000、Quadro RTX6000和Quadro RTX8000。
三、安培GPU架构
Ampere是Turing架构的继承者。基于8nm制造工艺,支持GDDR6、HBM2和GDDR6X显存。GDDR6X是目前最快的显存,速度最高可达21Gbps,带宽最高可达1TB/s。Ampere架构比Turing提供了显着改进,并配备了第2代RT核心和第3代Tensor核心。与Turing架构中使用的上一代RT和Tensor内核相比,这些新的RT和Tensor内核提供了大约2倍的吞吐量或性能。这意味着当游戏或应用程序支持光线追踪和AI技术时,您将在游戏和其他应用程序中获得显着的性能提升。
Ampere架构现在支持PCIe Gen4标准,这使PCIe Gen3接口的带宽增加了一倍。该架构支持CUDA 8.0版并包括2个FP32流式多处理器,这意味着与Turing相比,FP32性能翻倍。Ampere架构支持NVLink3.0,以增加使用多个GPU的系统的计算能力。与Turing架构相比,Ampere架构的每瓦性能提升高达1.9倍。
Ampere的另一个重要补充是支持HDMI2.1,支持8K@60Hz和4K@120Hz的超高分辨率和刷新率。它还支持动态HDR,HDMI2.1支持的总带宽为48Gbps。RTX IO是Ampere架构引入的另一项新功能,通过使用GPU解压缩GPU内存中的游戏纹理/数据,可以减少CPU I/O开销并显着减少游戏加载时间。此功能与Microsoft Windows Direct Storage API结合使用。采用Ampere架构的显卡为RTX30系列显卡,包括GeForce RTX3090、RTX3080、RTX3070等。
总结:Turing图灵和Ampere安培架构有什么区别?性能相差有多大?
Ampere架构在光线追踪和DLSS方面确实有着显著的改进,但即使不使用这些功能,Ampere的性能提升也比Turing更大。Ampere的另一个重要补充是提供更高带宽的PCIe Gen4支持,这对于战未来非常有用。