Abo
  1. Foren
  2. Kommentare
  3. Sonstiges
  4. Alle Kommentare zum Artikel
  5. › Cryengine 5.7: Crytek zeigt…
  6. Them…

@golem: auch die RT-Cores ... werden nicht genutzt

  1. Thema
  1. 1
  2. 2

Neues Thema Ansicht wechseln


  1. Re: @golem: auch die RT-Cores ... werden nicht genutzt

    Autor: dummdumm 14.05.19 - 13:55

    ms (Golem.de) schrieb:
    --------------------------------------------------------------------------------
    > Die 25x gelten freilich nicht für Spiele, sondern dediziert für die von
    > Nvidia genannten Gigarays. Und wie u.a. Dice aufgezeigt hat, ist der
    > Unterschied zwischen Volta und Turing schon teils sehr groß, der Abstand zu
    > Pascal ergo noch mehr.

    Ich wette auf die 25 fachen Gigarays kommt Nvidia nicht real, sondern unter der Annahme wie viel länger man hätte rechnen müssen, wenn die Tensor-Cores das Bild nicht entrauschen.

    Wenn man ein wenig nachdenkt sollte einem klar werden, dass auch allein das Raytracing nicht 25 mal schneller ist als bei Pascal. Sonst wäre der Leistungseinbruch bei Dice mit eingeschalteten RT-Effekten wohl kaum spürbar.

    Wenn auf Pascal die Leistung um ca. die Hälfte einbricht, warum dann auf Touring nicht nur um 1/25 davon?



    1 mal bearbeitet, zuletzt am 14.05.19 13:56 durch dummdumm.

  2. Re: @golem: auch die RT-Cores ... werden nicht genutzt

    Autor: Mimimimimi 14.05.19 - 15:11

    dummdumm schrieb:
    --------------------------------------------------------------------------------
    > Ich wette auf die 25 fachen Gigarays kommt Nvidia nicht real, sondern unter
    > der Annahme wie viel länger man hätte rechnen müssen, wenn die Tensor-Cores
    > das Bild nicht entrauschen.
    Nein. Siehe Turing-Präsentation.

    > Wenn auf Pascal die Leistung um ca. die Hälfte einbricht, warum dann auf
    > Touring nicht nur um 1/25 davon?
    1. Turing hat gigantisch viel Shader-Leistung.
    2. Ist die RT-Berechnung nur ein Teil des Renderings.

  3. Re: @golem: auch die RT-Cores ... werden nicht genutzt

    Autor: platoxG 14.05.19 - 19:08

    Marketingaussagen bzgl. derartiger Zahlen sind in der Regel generell nicht für bare Münze zu nehmen. Das würde ich in diesem Fall nicht mal auf nVidia beschränken, denn hier wird vielfach eine theoretische Maximalleistung aus dem best-case in die Waagschale geworfen und irgendwie zu einem werbetauglichen Wert verwurstet.
    Im Falle von nVidia klang das schon für die 10 GigaRays/s der 2080 Ti irgendwie "schwierig fassbar", und erscheint bei dem Faktor x25 noch problematischer (der mir selbst aber entgangen ist und den ich zugegebenermaßen aber auch per se als schlichte Werbeaussage ignoriert hätte). Und noch obskurer wurde es in der Launch-Präsentation, als man die neue Einheit RTX-Ops präsentierte, in der man anscheinend allen Output aller Funktionseinheiten irgendwie zusammenwürfelte.
    Fazit: Am Ende zählen nur Real-Life-Benchmarks, d. h. mit echten, fertigen Spielen und Applikationen. Bei einer solchen Sachlage ist dieses Fazit aber auch nicht wirklich neu, bzw. es ist nicht erst mit nVidias Vorstellung von Turing relevant geworden.
    Ein Problem war natürlich, dass verfügbares Testmaterial in diesem konkreten Fall nicht nur rar, sondern schlicht nicht verfügbar war. Dice konnte als einziger etwas einige Wochen nach dem Launch vorzeigen, jedoch war das anfänglich nahezu unbrauchbar, da die RT-Operationen nur an die Renderpipeline der Frotbite-Engine hinten angehängt wurden und sich somit die Frametimes beträchtlich erhöhten, was dazu führt, dass man die Strahlverfolgungsweite (und LOD) für Reflektionen deutlich beschränken musste, was gleich zu ersten Aufschreien führte.

    Mittlerweile hat Dice die Integration in die Frostbite-Engine verbessert und auch nVidia hat im Treiber (und/oder auch bei Dice selbst) Hand angelegt und nun hat man ein recht brauchbares Endergebnis.
    Für eine Abschätzung der RT-Leistungsfähigkeit ist BF5 jedoch nicht die beste Wahl, da es lediglich RT-Reflektionen implementiert. Die Zahl der RT-Operationen hängt unmittelbar von den im Viewport gerenderten, reflektierenden Materialien (und der Reflektionsweite) ab. Beispielsweise auf "Tirallieur" gibt es im Mittel vergleichsweise wenig Reflektionen und das erklärt recht gut, warum auch eine 1080 Ti mit aktuellem Treiber hier verhältnismäßig gut (wenn auch deutlich langsamer) abschneidet. Auf "Rotterdam" würde man sicherlich schon einen im Vergleich höheren Performance-Drop beobachten (wobei aber auch die Frage ist, in wie weit Dice hier eingreift, um eine "konstant hohe FPS" beizubehalten).

    Ein besseres Beispiel dürfte jedoch Metro Exodus sein, das Raytracing für GI verwendet. Die Entwickler waren anscheind frühzeitig dabei, sich mit RTX zu befassen und hatten bis zum finalen Release zudem mehr Zeit als Dice und hier erscheint es schlussendlich so, als wenn die Integration in deren Engine konsequenter vollzogen worden wäre.
    Für die Leistungsabschätzung relevant ist hier, dass für die GI-Berechnung eine konstant hohe Anzahl an RT-Strahlen pro Pixel (pro Frame) in die Szene geschossen wird. Hier war mal während der Entwicklung die Rede von 3 Strahlen pro Pixel, die in einer zufälligen Richtung von der getroffenen Oberfläche reflektieren und Lichtproben einfammeln. Schlussendlich ist das natürlich viel zu wenig *) sodass hier die ermittelten Werte in-frame für benachbarte Pixel gemittel bzw. mitverwendet werden und auch die Ergebnisse über mehrere Frames hinweg gemittelt und wiederverwendet werden, sodass man am Ende mit einer durchdachten Filterung doch noch zu einem brauchbaren Ergebnis kommt.
    In FullHD in der "Illustrious Gloom"-Demo mit RTX/Ultra schafft eine Asus RTX 2080 Ti Strix OC 77 min/85 avg FPS, während eine Asus GTX 1080 Ti Strix OC nur 13 min/14 avg FPS schafft, was der hohen RT-Last geschuldet ist. (Entsprechend bleiben zumindest aktuell aber auch keine Reservern für raytraced reflections, da diese zusätzliche Strahlen notwendig machen würden, so dass Metro Exodus sich hier klassischer Techniken bedient. Hier bleibt abzuwarten was tiefere Integrationen in modernisierte Engines bieten sowie 2nd Gen Hardware in 2020.)


    *) Wer bspw. Blender zur Hand hat, kann sich zumindest schnell einen ungefähren Eindruck verschaffen, indem man in Cycles die Strahlzahl in den Render-Settings auf 3 reduziert. Das Ergebnis wird sehr verrauscht und so gar nicht Raytracing-mäßig aussehen.

  4. Re: @golem: auch die RT-Cores ... werden nicht genutzt

    Autor: dummdumm 14.05.19 - 22:41

    Reprojection funktioniert für GI recht gut. Für Reflections dagegen praktisch garnicht. Ich habe noch immer starke Zweifel, dass so ein Faktor 5 bei RT von Pascal zu Touring real ist.

    Die Triangle Intersection wird aufgrund der sache, dass dafür nur Vec*Mat benötigt wird kaum schneller werden.

    Bleibt nur das BVH irgendwie zu beschleunigen und zu parallelisieren. Das ist aufgrund des Branching die größte Bremse, wenn nicht alle Shader im Warp (oder war es Wrap?) den selben Pfad nehmen. Aber 5 mal schneller? Wohl kaum, sonst wird die nächste Generation der GPU Raytracer (Octane, VRay..) episch schnell.

    Das einzige was nun sein könnte, dass die “RT-Cores“ nur etwas bringen, während die SMs mit anderem zu tun haben.

    Was mich so gestört hatte, ist dass in den Ursprünglichen Artikeln hier den RT-Cores eigene Rechenwerke zugesprochen wurden, die dann für RT notwendige RT-Ops berechnen können. Dazu der Faktor 25, dass zusammen teils unreflektiert als Fakt und nicht als Behauptung NVidias formuliert ließ mir die Hutschnur platzen.

    PS: Die eigentliche Antwort musst du jetzt auf dem Bolzplatz suchen, dabei stand dort gar nichts schlimmes drin...



    1 mal bearbeitet, zuletzt am 14.05.19 22:48 durch dummdumm.

  5. Re: @golem: auch die RT-Cores ... werden nicht genutzt

    Autor: dummdumm 14.05.19 - 22:46

    Mimimimimi schrieb:
    --------------------------------------------------------------------------------
    > dummdumm schrieb:
    > ---------------------------------------------------------------------------
    > -----
    > > Ich wette auf die 25 fachen Gigarays kommt Nvidia nicht real, sondern
    > unter
    > > der Annahme wie viel länger man hätte rechnen müssen, wenn die
    > Tensor-Cores
    > > das Bild nicht entrauschen.
    > Nein. Siehe Turing-Präsentation.

    Na dann muss es ja Stimmen!

    > > Wenn auf Pascal die Leistung um ca. die Hälfte einbricht, warum dann auf
    > > Touring nicht nur um 1/25 davon?
    > 1. Turing hat gigantisch viel Shader-Leistung.

    25 mal mehr als Pascal?

    > 2. Ist die RT-Berechnung nur ein Teil des Renderings.

    Und was tut das zur Sache, wenn es ums RT geht?

  6. Re: @golem: auch die RT-Cores ... werden nicht genutzt

    Autor: Mimimimimi 15.05.19 - 08:48

    dummdumm schrieb:
    --------------------------------------------------------------------------------
    > Na dann muss es ja Stimmen!
    Hast du Belege, dass dem nicht so ist?

    > 25 mal mehr als Pascal?
    Ungefähr 30% mehr als 1080Ti und RTX2080Ti.

    Dennoch ist die Karte mit RTX aktiviert deutlich langsamer als eine 1080Ti.

    Von Pascal Benches mal ganz abgesehen:
    > https://www.tomshardware.com/reviews/nvidia-pascal-ray_tracing-tested,6085.html

    > Und was tut das zur Sache, wenn es ums RT geht?
    Wenn du das nicht weißt, dann weißt du offensichtlich auch nicht, wie Rendering oder eine Grafikkarte funktioniert und dann ist es schlicht sinnlos dir das zu erklären, weil du es mangels Grundwissen einfach nicht verstehen wirst.

  1. Thema
  1. 1
  2. 2

Neues Thema Ansicht wechseln


Um zu kommentieren, loggen Sie sich bitte ein oder registrieren Sie sich. Zum Login

Stellenmarkt
  1. Energiedienst Holding AG, Rheinfelden (Baden),Schallstadt
  2. Advantest Europe GmbH, Amerang
  3. Hays AG, Memmingen
  4. Bayerische Versorgungskammer, München

Golem pur
  • Golem.de ohne Werbung nutzen

Anzeige
Spiele-Angebote
  1. 4,60€
  2. 4,99€
  3. (-44%) 27,99€
  4. 26,99€


Haben wir etwas übersehen?

E-Mail an news@golem.de


Watch Dogs Legion angespielt: Eine Seniorin als Ein-Frau-Armee
Watch Dogs Legion angespielt
Eine Seniorin als Ein-Frau-Armee

E3 2019 Elitesoldaten brauchen wir nicht - in Watch Dogs Legion hacken und schießen wir auch als Pensionistin für den Widerstand. Beim Anspielen haben wir sehr über die ebenso klapprige wie kampflustige Oma Gwendoline gelacht.


    Ada und Spark: Mehr Sicherheit durch bessere Programmiersprachen
    Ada und Spark
    Mehr Sicherheit durch bessere Programmiersprachen

    Viele Sicherheitslücken in Software sind auf Programmierfehler zurückzuführen. Diese Fehler lassen sich aber vermeiden - und zwar unter anderem durch die Wahl einer guten Programmiersprache. Ada und Spark gehören dazu, leider sind sie immer noch wenig bekannt.
    Von Johannes Kanig

    1. Das andere How-to Deutsch lernen für Programmierer
    2. Programmiersprachen, Pakete, IDEs So steigen Entwickler in Machine Learning ein

    Final Fantasy 7 Remake angespielt: Cloud Strife und die (fast) unendliche Geschichte
    Final Fantasy 7 Remake angespielt
    Cloud Strife und die (fast) unendliche Geschichte

    E3 2019 Das Remake von Final Fantasy 7 wird ein Riesenprojekt, allein die erste Episode erscheint auf zwei Blu-ray-Discs. Kurios: In wie viele Folgen das bereits enorm umfangreiche Original von 1997 aufgeteilt wird, kann bislang nicht mal der Producer sagen.

    1. Final Fantasy 14 Online Report Zwischen Cosplay, Kirmes und Kampfsystem
    2. Square Enix Final Fantasy 14 erhält Solo-Inhalte und besonderen Magier
    3. Rollenspiel Square Enix streicht Erweiterungen für Final Fantasy 15

    1. Verdi: Paypal Europe plant massiven Stellenabbau in Berlin
      Verdi
      Paypal Europe plant massiven Stellenabbau in Berlin

      Trotz hoher Gewinne will Paypal eine ganze Abteilung in Berlin schließen. Es sollen fast alle Beschäftigten im Stadtteil Wilmersdorf entlassen werden.

    2. Fußball: PES 2020 mit Messi und Maradona plus neuer Kameraperspektive
      Fußball
      PES 2020 mit Messi und Maradona plus neuer Kameraperspektive

      Interaktive Transferverhandlungen mit Maradona und Cruyff, besseres Dribbling und eine neue Kameraperspektive sowie Rasen-Rendering: Konami stellt einige der Neuheiten von PES 2020 vor. Im Trailer sieht manches leider unfreiwillig komisch aus.

    3. Fernseher: Konsumenten wollen große Bildschirme statt HDR und OLED
      Fernseher
      Konsumenten wollen große Bildschirme statt HDR und OLED

      Eine Umfrage der Gfu sieht große Displaydiagonalen als primären Kaufgrund für neue TV-Geräte. Von HDR und OLED haben viele Leute allerdings kaum eine Ahnung. Und doch sind viele bereit, mehr als 1.000 Euro für einen neuen Fernseher zu bezahlen.


    1. 17:35

    2. 17:18

    3. 17:03

    4. 16:28

    5. 16:13

    6. 15:47

    7. 15:35

    8. 15:19