mstation:gpu
差别
这里会显示出您选择的修订版和当前版本之间的差别。
| 两侧同时换到之前的修订记录前一修订版后一修订版 | 前一修订版 | ||
| mstation:gpu [2024/03/22 15:00] – [表] pengge | mstation:gpu [2025/10/20 12:02] (当前版本) – [表] pengge | ||
|---|---|---|---|
| 行 3: | 行 3: | ||
| ===== FP32 FP64 性能比较(数据来自 官网和维基) ===== | ===== FP32 FP64 性能比较(数据来自 官网和维基) ===== | ||
| - | ^ gpu卡 | + | ^ gpu卡 |
| - | | 3080ti | + | | 3080ti |
| - | | 3090 | 35.58 | 0.556 | Ampere | + | | 3090 | 35.58 | 0.556 | Ampere |
| - | | 4090 | 82.58 | 1.29 | Ada Lovelace | + | | 4090 | 82.58 | 1.29 | Ada Lovelace |
| - | | a100 | 19.5 | 9.7 | Ampere | + | | a100 | 19.5 | 9.7 | Ampere |
| - | | a10 | + | | a10 |
| - | | a40 | + | | a40 |
| - | | L40 | + | | L40 |
| - | | a800 | 19.5 | 9.7 | Ampere | + | | a800 | 19.5 | 9.7 | Ampere |
| + | | T400 | 2.17 | 0.068 | Turing | ||
| + | | p100 | 9.3 | 4.7 | Pascal | ||
| + | | H200 | 149.0 | 74.5 | Hopper | ||
| + | | L20 | 119.2 | 3.73 | Ada Lovelace | ||
| + | | V100 | 14.0 | 7.0 | Volta | sm_70 | cuda11.6/ | ||
| + | | H100 | 134.0 | 67.0 | Hopper | ||
| + | | 5090 | | ||
| + | | RTX 5880 Ada | 69.3 | 1.08 | Ada Lovelace | ||
| + | | A5000 | 27.8 | 0.866 | Ampere | ||
| + | |||
| + | <code bash> | ||
| + | nvcc -arch=sm_70 my_kernel.cu -o my_program | ||
| + | nvcc -arch=sm_80 --ptxas-options=-O3 my_kernel.cu -o my_program | ||
| + | nvcc -arch=sm_90 --ptxas-options=-O3 -o my_program my_kernel.cu | ||
| + | |||
| + | 若需代码在多种 GPU 上运行,可通过 PTX 兼容性 或 多架构编译: | ||
| + | # 为多架构生成代码(例如支持 Ampere 和 Hopper) | ||
| + | nvcc -gencode arch=compute_80, | ||
| + | | ||
| + | | ||
| + | </ | ||
| - FP32:单精度浮点计算能力 | - FP32:单精度浮点计算能力 | ||
| 行 81: | 行 103: | ||
| - | > | + | >- https:// |
| + | >- https:// | ||
| > | > | ||
| >官方 4090 规格参数 Specs | >官方 4090 规格参数 Specs | ||
| 行 100: | 行 123: | ||
| > | > | ||
| > Nvidia 显卡架构详解 | > Nvidia 显卡架构详解 | ||
| + | |||
| + | > https:// | ||
| + | > | ||
| + | > p100 v100 a100 h100 b100 对比 | ||
| + | ===== 显卡架构参考 ===== | ||
| + | |||
| + | ^ 显卡架构 | ||
| + | | Ada Lovelace | ||
| + | | Ampere | ||
| + | | Hopper | ||
| + | | Turing | ||
| + | | Volta | https:// | ||
| + | |||
mstation/gpu.1711090859.txt.gz · 最后更改: 2024/03/22 15:00 由 pengge
