mstation:gpu
这是本文档旧的修订版!
gpu 卡性能对比
FP32 FP64 性能比较(数据来自 官网和维基)
| gpu卡 | FP32(TFLOPS) | FP64(TFLOPS) | 架构 |
|---|---|---|---|
| 3080ti | 34.1 | 0.533 | Ampere |
| 3090 | 35.58 | 0.556 | Ampere |
| 4090 | 82.58 | 1.29 | Ada Lovelace |
| a100 | 19.5 | 9.7 | Ampere |
| a10 | 31.24 | 0.976 | Ampere |
| L40 | 90.516 | 1.414 | Ada Lovelace |
| a800 | Ampere |
- FP32:单精度浮点计算能力
- FP64:双精度浮点计算能力
在 GPU 的性能比较中,FP32(单精度浮点运算)通常是更为关键和普遍关注的一个性能指标。
FP32 主要用于深度学习、图形渲染等许多计算密集型任务,
因此在这些领域中,FP32 算力通常被广泛用来评估 GPU 的性能。
而 FP64 主要在科学计算、数值模拟等需要更高精度计算的领域才会被重点关注
对于大多数应用来说,FP32 已经足够满足精度要求,并且可以获得更高的计算效率和更低的功耗。
对于对精度要求极高的应用,例如科学计算、金融模拟等,则需要使用 FP64 来保证计算结果的准确性。
Ada Lovelace 和 Hopper 是同一代架构,只是分别供货给超算领域和消费级市场。
消费级芯片会带有 RT Core,这些处理器在 Data Center 是用不上的。
所以是同一代制程工艺、架构设计,微调衍生出来的2个变种。
参考
https://en.wikipedia.org/wiki/GeForce_30_series
https://en.wikipedia.org/wiki/GeForce_40_series
A100
A10, L40
维基收录 3080ti 3090 4090 a100 规格参数
mstation/gpu.1709015178.txt.gz · 最后更改: 2024/02/27 14:26 由 pengge

评论