-
erstaunliche leistungsdaten @ FP32
Autor: amdonly 16.11.20 - 19:20
vergleicht man die mi100 direkt mit den leistungswerten einer a100, offenbart sich eine seltsame leistungs-differenzierung der "gpus":
während nvidia mit sog. tensorcores seine FP64-leistungsdaten erstaunlicherweise verdoppeln kann, geschieht dies bei amd @ FP32.
könnte es sein, dass beide konzerne hier eine absprache getroffen haben? denn eigentlich müsste die mi100 die nvidia in hpc, also auch fp64, obsolet machen!
für mich wirkt es zumindest seitens amd so, als ob man nvidia noch etwas luft zum atmen lässt im hpc-umfeld. sonst würde niemand mehr die a100 kaufen für reines hpc mit höchster genauigkeit.
auch sehr auffällig sind die sog. ai-leistungsdaten, die von fp16 bis int4 wie gekapped wirken @ 184,6 TFlops. eigentlich kennt man es eher so, dass sich die leistung mit geringerer rechengenauigkeit jeweils verdoppelt...
ist das hier wieder eine künstliche drosselung der amd "gpu" oder hat man hier versucht, bloß die veralteten gcn-xyz shaderkerne ewas aufzuwerten, um erst mit cdna2 richtig durchzustarten?
genaueres wird man wohl erst mit richtigen hpc-benchmarks herausfinden können...
5 mal bearbeitet, zuletzt am 16.11.20 19:26 durch amdonly. -
Re: erstaunliche leistungsdaten @ FP32
Autor: ms (Golem.de) 16.11.20 - 19:34
Ist schon kurios mit INT8 und INT4, denn bei Vega 20 verdoppelt sich ja die Performance ...
Marc Sauter, Sr Editor
Golem.de