这是本文档旧的修订版！

gpu 卡性能对比

FP32 FP64 性能比较(数据来自官网和维基)

gpu卡	FP32(TFLOPS)	FP64(TFLOPS)
3080ti	34.1	0.533
3090	35.58	0.556
4090	82.58	1.29
a100	19.5	9.7
a10	31.24	0.976
L40	90.516	1.414

FP32：单精度浮点计算能力
FP64：双精度浮点计算能力

在 GPU 的性能比较中，FP32（单精度浮点运算）通常是更为关键和普遍关注的一个性能指标。
FP32 主要用于深度学习、图形渲染等许多计算密集型任务，
因此在这些领域中，FP32 算力通常被广泛用来评估 GPU 的性能。

而 FP64 主要在科学计算、数值模拟等需要更高精度计算的领域才会被重点关注

对于大多数应用来说，FP32 已经足够满足精度要求，并且可以获得更高的计算效率和更低的功耗。

对于对精度要求极高的应用，例如科学计算、金融模拟等，则需要使用 FP64 来保证计算结果的准确性。

参考

https://www.nvidia.com/en-us/data-center/a100/

官方 a100 规格参数 Specifications

https://www.nvidia.com/en-us/geforce/graphics-cards/30-series/rtx-3080-3080ti/

官方 3080ti 规格参数 Specs

https://www.nvidia.com/en-us/geforce/graphics-cards/30-series/rtx-3090-3090ti/

官方 3090 规格参数 Specs

https://www.nvidia.com/en-us/geforce/graphics-cards/40-series/rtx-4090/

官方 4090 规格参数 Specs

https://en.wikipedia.org/wiki/GeForce_30_series

https://en.wikipedia.org/wiki/GeForce_40_series

A100

维基收录 3080ti 3090 4090 a100 规格参数

龙讯旷腾 pwmat Wiki

目录

gpu 卡性能对比

FP32 FP64 性能比较(数据来自官网和维基)

参考

评论

目录

gpu 卡性能对比

FP32 FP64 性能比较(数据来自 官网和维基)

参考

评论

FP32 FP64 性能比较(数据来自官网和维基)