这是本文档旧的修订版！

gpu 卡性能对比

FP32 FP64 性能比较(数据来自官网和维基)

gpu卡	FP32(TFLOPS)	FP64(TFLOPS)	架构
3080ti	34.1	0.533	Ampere
3090	35.58	0.556	Ampere
4090	82.58	1.29	Ada Lovelace
a100	19.5	9.7	Ampere
a10	31.24	0.976	Ampere
L40	90.516	1.414	Ada Lovelace
a800			Ampere

FP32：单精度浮点计算能力
FP64：双精度浮点计算能力

在 GPU 的性能比较中，FP32（单精度浮点运算）通常是更为关键和普遍关注的一个性能指标。
FP32 主要用于深度学习、图形渲染等许多计算密集型任务，
因此在这些领域中，FP32 算力通常被广泛用来评估 GPU 的性能。

而 FP64 主要在科学计算、数值模拟等需要更高精度计算的领域才会被重点关注

对于大多数应用来说，FP32 已经足够满足精度要求，并且可以获得更高的计算效率和更低的功耗。

对于对精度要求极高的应用，例如科学计算、金融模拟等，则需要使用 FP64 来保证计算结果的准确性。

Ada Lovelace 和 Hopper 是同一代架构，只是分别供货给超算领域和消费级市场。

消费级芯片会带有 RT Core，这些处理器在 Data Center 是用不上的。

所以是同一代制程工艺、架构设计，微调衍生出来的2个变种。

参考

https://www.nvidia.com/en-us/data-center/a100/

官方 a100 规格参数 Specifications

https://www.nvidia.com/en-us/geforce/graphics-cards/30-series/rtx-3080-3080ti/

官方 3080ti 规格参数 Specs

https://www.nvidia.com/en-us/geforce/graphics-cards/30-series/rtx-3090-3090ti/

官方 3090 规格参数 Specs

https://www.nvidia.com/en-us/geforce/graphics-cards/40-series/rtx-4090/

官方 4090 规格参数 Specs

https://en.wikipedia.org/wiki/GeForce_30_series

https://en.wikipedia.org/wiki/GeForce_40_series

A100

A10, L40

维基收录 3080ti 3090 4090 a100 规格参数

https://www.twisted-meadows.com/nvidia-gpu-architecture/

Nvidia 显卡架构详解

龙讯旷腾 pwmat Wiki

目录

gpu 卡性能对比

FP32 FP64 性能比较(数据来自官网和维基)

参考

评论

目录

gpu 卡性能对比

FP32 FP64 性能比较(数据来自 官网和维基)

参考

评论

FP32 FP64 性能比较(数据来自官网和维基)