mstation:gpu
这是本文档旧的修订版!
gpu 卡性能对比
FP32 FP64 性能比较(数据来自 官网和维基)
| gpu卡 | FP32(TFLOPS) | FP64(TFLOPS) |
|---|---|---|
| 3080ti | 34.1 | 0.533 |
| 3090 | 35.58 | 0.556 |
| 4090 | 82.58 | 1.29 |
| a100 | 19.5 | 9.7 |
| a10 | 31.24 | 0.976 |
| L40 | 90.516 | 1.414 |
- FP32:单精度浮点计算能力
- FP64:双精度浮点计算能力
在 GPU 的性能比较中,FP32(单精度浮点运算)通常是更为关键和普遍关注的一个性能指标。
FP32 主要用于深度学习、图形渲染等许多计算密集型任务,
因此在这些领域中,FP32 算力通常被广泛用来评估 GPU 的性能。
而 FP64 主要在科学计算、数值模拟等需要更高精度计算的领域才会被重点关注
对于大多数应用来说,FP32 已经足够满足精度要求,并且可以获得更高的计算效率和更低的功耗。
对于对精度要求极高的应用,例如科学计算、金融模拟等,则需要使用 FP64 来保证计算结果的准确性。
参考
https://en.wikipedia.org/wiki/GeForce_30_series
https://en.wikipedia.org/wiki/GeForce_40_series
A100
维基收录 3080ti 3090 4090 a100 规格参数
mstation/gpu.1708335833.txt.gz · 最后更改: 2024/02/19 17:43 由 pengge

评论