1. Foren
  2. Kommentare
  3. PC-Hardware
  4. Alle Kommentare zum Artikel
  5. › Hawk: Deutscher 24-Petaflops…

geleakte Folie mit Takt uvm.

  1. Thema

Neues Thema Ansicht wechseln


  1. geleakte Folie mit Takt uvm.

    Autor: tommihommi1 14.11.18 - 01:02

    5000 Nodes

    Je dual-socket, 2x 64 Kerne mit 2.35 GHz, also 640000 Kerne insgesamt

    2.4TFLOPS pro CPU ist sehr ordentlich

  2. Re: geleakte Folie mit Takt uvm.

    Autor: itse 14.11.18 - 05:08

    tommihommi1 schrieb:
    --------------------------------------------------------------------------------
    > 5000 Nodes
    >
    > Je dual-socket, 2x 64 Kerne mit 2.35 GHz, also 640000 Kerne insgesamt
    >
    > 2.4TFLOPS pro CPU ist sehr ordentlich

    wobei eine vega20 später noch 7.4 tflop dualprecision nachschießt ;)
    und davon sollten bis zu vier pro 1he-2he rackserver passen.

    mfg

  3. Re: geleakte Folie mit Takt uvm.

    Autor: Theoretiker 14.11.18 - 11:56

    Klar, die NVIDIA GPUs haben eine enorme theoretische Leistung. Allerdings hat man den nicht zu verachtenden Nachteil, dass man sein Programm für die GPU nochmal neu programmieren muss. Damit die Performance stimmt, kommt man um CUDA oder entsprechenden von NVCC kompilierten C++-Code nicht herum. Man muss die Datenstrukturen auf die GPU anpassen, das macht man nicht mal eben so. Von daher gibt es viele bestehende Simulationspakete (häufig dann in FORTRAN), die man nicht mal auf die GPU portieren kann. Die Anwender freuen sich dann über eine reine CPU-Maschine.

    Wenn man sein Problem auf der GPU machen kann, wie zum Beispiel Gleichungssystemlösen, ist die Performance wirklich beachtlich. Wir haben in unserem Cluster pro Node zwei Intel Xeon und acht NVIDIA P100. Da kommen wir mit dem Abschicken der Jobs schon fast nicht mehr hinterher 😀.

    Vergleichen sollte man wohl eher mit Intel Xeon Phi (Knights Landing, KNL). Das sind CPUs mit 68 Kernen (64 und 72 gibt es auch noch), die AVX512 unterstützen und vier Threads pro Kern. Dazu 16 GB schnellen RAM (450 GB/s) direkt auf dem Paket, das als L3-Cache genutzt werden kann. Die haben nach Intels Schönrechnen 3.5 TF/s. Und es kann auch ganz normaler x86-64 Code drauf laufen, wobei die Performance dann weit von dem entfernt ist.

    Es gibt jetzt einige KNL Systeme: JURECA Booster (FZ Jülich), Marconi A2 (Cineca, Bologna), Frioul (CINES, Montpellier), Cori (NERSC, Berkeley). Die Teile bieten sich für viele CPU-Codes an, die mit mehr Threads umgehen können also die Dual Socket Xeon bisher geliefert haben. Es ist schön zu sehen, dass AMD jetzt auch wieder in HPC-Systemen vertreten ist!

  1. Thema

Neues Thema Ansicht wechseln


Um zu kommentieren, loggen Sie sich bitte ein oder registrieren Sie sich. Sie müssen ausserdem in Ihrem Account-Profil unter Forum einen Nutzernamen vergeben haben. Zum Login

Stellenmarkt
  1. Interhyp Gruppe, München
  2. Mediaopt GmbH, Berlin
  3. Allianz Lebensversicherungs - AG, Stuttgart
  4. Berliner Verkehrsbetriebe (BVG), Berlin

Golem pur
  • Golem.de ohne Werbung nutzen

Anzeige
Spiele-Angebote
  1. 9,99€
  2. (u. a. Elite Dangerous für 5,99€, Struggling für 7,25€, Planet Zoo für 21,99€, Planet...
  3. 14,49€


Haben wir etwas übersehen?

E-Mail an news@golem.de