1. Foren
  2. Kommentare
  3. Sonstiges-Forum
  4. Alle Kommentare zum Artikel
  5. › Nvidia Titan V: Die neue…

Zielgruppe?

Neue Foren im Freiraum! Raumfahrt und freie Software haben jetzt einen Platz, die Games tummeln sich jetzt alle in einem Forum.
  1. Thema

Neues Thema Ansicht wechseln


  1. Zielgruppe?

    Autor: Theoretiker 08.12.17 - 22:45

    Ich sehe bei einer 1080 Ti, dass die an die Gamer gerichtet ist. Die P100 haben wir im Computerraum f黵 letztlich lineare Algebra. Aber was will man mit dieser Karte? Die ist zwar g黱stiger als die P100, aber ich halte es f黵 merkw黵dig, dass man sich nur eine einzige Grafikkarte kauft.

    Wenn man als Arbeitsgruppe Deep Learning macht, dann w黵de ich eher einen Server mit vielleicht acht P100 oder V100 Karten hinstellen und jedem Mitarbeiter noch eine kleine Karte geben, damit er die Sachen lokal mit kleinen Datenmengen testen kann. Das erscheint mir sinnvoller als jedem Mitarbeiter so eine Titan V zu kaufen.

    躡ersehe ich da etwas?

  2. Re: Zielgruppe?

    Autor: honna1612 09.12.17 - 01:19

    Ja sie 黚ersehen etwas. Aus dem Datenblatt:
    Die Tensor-Kerne sind f黵 Deep Learning optimiert und berechnen 4󫶘-Matrizen mit 120 Tflops. Mit 32bit float.

    Jede N x N Matrix kann berechnet werden indem man kleinere Matrizen als Maske dar黚erschiebt und summiert. Wenn man Matrizen multiplizieren will hat man die Tensor cores UND die gpgpu kerne. Also etwa 135 Tflop pro Karte.
    Mit 900Gbyte/s HBM2 ist man auch nicht Speicherlimitiert.

    Dh. Matrix multiplizieren kann die Karte 6x so schnell wie ALLES BISHER mit 135 Tflops.
    F黵 OpenCl ist sie mit 15 Tflops nicht viel schneller und teils langsamer als existierende karten.

  3. Re: Zielgruppe?

    Autor: Theoretiker 09.12.17 - 12:41

    honna1612 schrieb:
    --------------------------------------------------------------------------------
    > Ja sie 黚ersehen etwas. Aus dem Datenblatt:
    > Die Tensor-Kerne sind f黵 Deep Learning optimiert und berechnen
    > 4󫶘-Matrizen mit 120 Tflops. Mit 32bit float.

    Aber kann die Tesla V100 das nicht auch? Die Tensorperformance wird da 鋒nlich angegeben.

    > Jede N x N Matrix kann berechnet werden indem man kleinere Matrizen als
    > Maske dar黚erschiebt und summiert. Wenn man Matrizen multiplizieren will
    > hat man die Tensor cores UND die gpgpu kerne. Also etwa 135 Tflop pro
    > Karte.

    Ich bezweifle, dass man das so einfach rechnen kann.

    > Mit 900Gbyte/s HBM2 ist man auch nicht Speicherlimitiert.

    Oh doch! Wir rechnen auch auf Intel Xeon Phi Knights Landing 7250. Dort ist die Speicherbandbreite 450 GB/s, und das limitiert uns. Unsere arithmetische Intensit鋞 (FLOP pro Byte Speicherzugriff) ist bei ungef鋒r 1. Das bedeutet, dass wir nur auf ungef鋒r 450 GFLOPS kommen k鰊nen. Mit der Titan V hier (oder der Tesla V100) haben wir dann eben 900 GFLOPS maximal. Unsere Tensoren sind leider eben nicht dicht besetzt, daher ist die Intensit鋞 so schlecht.

    Um die genannten Zahlen zu bekommen, braucht man ein homogenes und dicht besetztes Problem. Wenn man das hat, dann ist nat黵lich gut.

    > F黵 OpenCl ist sie mit 15 Tflops nicht viel schneller und teils langsamer
    > als existierende karten.

    NVIDIA hat es ja auch gut geschafft, dass die Wissenschaftler CUDA nutzen und nicht OpenCL, somit ist die OpenCL Performance auch eigentlich egal. Es kauft in dem Bereich ja eh niemand AMD, von daher kann man sich diesem Monopol auch einfach ergeben.


    Ansonsten scheint der Unterschied in der Performance zwischen Tesla V100 und Titan V echt nicht so gro zu sein. Je nach Anforderung kann man sich den Aufpreis f黵 die Tesla V100 also wohl sparen.

  1. Thema

Neues Thema Ansicht wechseln


Um zu kommentieren, loggen Sie sich bitte ein oder registrieren Sie sich. Sie m黶sen ausserdem in Ihrem Account-Profil unter Forum einen Nutzernamen vergeben haben. Zum Login

Stellenmarkt
  1. Softwareentwickler für C++ / Python (m/w/d)
    e.solutions GmbH, Erlangen
  2. Informatikerin / Informatiker (w/m/d) für Data Center Infrastruktur am Zentrum für Informationstechnologie ... (m/w/d)
    Universität Passau, Passau
  3. Service Manager Datenbanksysteme (m/w/d)
    operational services GmbH & Co. KG, Leinfelden-Echterdingen, Dresden, Ingolstadt, Wolfsburg
  4. Informatiker/in (m/w/d) (FH-Diplom / Bachelor / Fachinformatiker/in [m/w/d])
    Zentrum Bayern Familie und Soziales, Bayreuth, München

Detailsuche


Golem pur
  • Golem.de ohne Werbung nutzen

Anzeige
Hardware-Angebote


Haben wir etwas übersehen?

E-Mail an news@golem.de