Abo
  1. Foren
  2. Kommentare
  3. Software-Entwicklung
  4. Alle Kommentare zum Artikel
  5. › GPU-Programmierung: AMD…

OpenCL

  1. Thema

Neues Thema Ansicht wechseln


  1. OpenCL

    Autor: bstea 15.06.11 - 19:11

    Ich hab' immer zwischen OpenCL und CUDA/Stream unterschieden, frag' mich ob das der Autor hier auch versteht.
    Ersteres hat das Ziel eine einfache gemeine Basis zu erstellen und Aufgaben von allen Recheneinheiten also auch GPU zu nutzen und letztere dienen zum ausschließlichen berechnen auf der Grafikkarte. Nebenbei wurde OpenCL auch mit Hilfe von AMD weiterentwickelt.

  2. Re: OpenCL

    Autor: TheUltimateStar 15.06.11 - 22:06

    Hatte mich erst letzte Woche damit kurz beschäftigt, der Syntax von CUDA und OpenCL schien ja erstmal nicht sonderlich groß zu sein, auch das Drumherum wirkte ähnlich. Sofern es vom Hersteller beides einigermaßen unterstützt wird dürfte die Performance doch gleich sein, womit der Punkt bei mir erstmal an OpenCL ging.
    Okay, die erreichte Geschwindigkeit blieb weiter hinter den Erwartungen zurück, aber das schob ich mal auf mein mangelndes Detailwissen :D

  3. Re: OpenCL

    Autor: pwn2own 16.06.11 - 00:03

    TheUltimateStar schrieb:
    --------------------------------------------------------------------------------
    > Okay, die erreichte Geschwindigkeit blieb weiter hinter den Erwartungen
    > zurück, aber das schob ich mal auf mein mangelndes Detailwissen :D

    Da magst du wohl recht haben. Bei GPGPU gbt es viele kleine Schräubchen und Zahnrädern, an denen man drehen kann/muss, damit es ordentlich läuft :)

  4. Re: OpenCL

    Autor: TheUltimateStar 16.06.11 - 05:41

    pwn2own schrieb:
    --------------------------------------------------------------------------------
    > Da magst du wohl recht haben. Bei GPGPU gbt es viele kleine Schräubchen und
    > Zahnrädern, an denen man drehen kann/muss, damit es ordentlich läuft :)
    Als Informatiker gefallen einem diese viele Schräubchen ja eigentlich auch, hätte aber halt schon erwartet das ein Straight-Forward-Lösung zu mindestens erstmal eine solide Leistung erzielt. Luft zum Optimum wäre ja verständlich, aber das meine stupide SSE-Implementierung fast 10x so schnell ist spricht nicht für die Einsteigerfreundlichkeit des Frameworks. Wobei ich im Nachhinein aber auch denke dass das Problem auch nicht so gut auf die GPU passt, letztlich sollte da nur jedes Texel einer Luminenztexture mit einem Gewicht aus einem Float-Puffer multipliziert und aufaddiert werden. Dabei jedes Texel nur genau einmal zu lesen und quasi dazwischen nichts groß zu tun überfordert die Texelfetch-Units vielleicht, dem widerspricht nur ein wenig dass das Hinzufügen der Multiplikation mit den Gewichten nochmal im Vergleich zum reinen aufsummieren deutlich Zeit kostet. Aber da ich in der Zeit die zum synchronisieren zwischen OpenGL und OpenCL notwendig ist die Textur auch genauso gut in den Hauptspeicher kopiert habe war es letztlich halt sinnlos da weiter die ms zusammen zu suchen.

  5. Re: OpenCL

    Autor: rayo 06.09.11 - 12:49

    Hallo

    Was mir zu deinem Problem gerade einfällt:
    - Float-Puffer muss am Anfang in den Shared Memory geladen werden (jeder Thread 1 Wert)
    - Jeder Thread sollte dann mehrere Werte in der Textur mit dem Puffer multiplizieren. Wenn N Threads laufen, sollte Thread 1 die Werte an Position ThreadID, ThreadID+N, ThreadId+2N, etc berechnen. Damit laden die einzelnen Threads die Daten sequentiell (was schneller ist)


    Also was zu beachten ist:
    - Shared memory ist für viele Zugriffe innerhalb einer WorkUnit schnell
    - Daten aus dem Global Memory immer Sequentiell laden
    - Nicht zu wenige Berechnungen pro Thread
    - Work Load der GPU sollte möglichst gross sein (limiterender Faktor könnte shared memory, register count, thread count, workload unit size sein)


    Gruss

  1. Thema

Neues Thema Ansicht wechseln


Um zu kommentieren, loggen Sie sich bitte ein oder registrieren Sie sich. Zum Login

Stellenmarkt
  1. ekom21 - KGRZ Hessen, Darmstadt, Gießen, Kassel
  2. Fraunhofer-Institut für Hochfrequenzphysik und Radartechnik FHR, Aachen
  3. MAINGAU Energie GmbH, Obertshausen
  4. SCHILLER Medizintechnik GmbH, Feldkirchen

Golem pur
  • Golem.de ohne Werbung nutzen

Anzeige
Spiele-Angebote
  1. (-67%) 3,30€
  2. 0,49€
  3. 4,99€
  4. (-12%) 52,99€


Haben wir etwas übersehen?

E-Mail an news@golem.de


Atari Portfolio im Retrotest: Endlich können wir unterwegs arbeiten!
Atari Portfolio im Retrotest
Endlich können wir unterwegs arbeiten!

Ende der 1980er Jahre waren tragbare PCs nicht gerade handlich, der Portfolio von Atari war eine willkommene Ausnahme: Der erste Palmtop-Computer der Welt war klein, leicht und weitestgehend DOS-kompatibel - ideal für Geschäftsreisende aus dem Jahr 1989 und Nerds aus dem Jahr 2019.
Ein Test von Tobias Költzsch

  1. Retrokonsole Hauptverantwortlicher des Atari VCS schmeißt hin

Gemini Man: Überflüssiges Klonexperiment
Gemini Man
Überflüssiges Klonexperiment

Am 3. Oktober kommt mit Gemini Man ein ambitioniertes Projekt in die deutschen Kinos: Mit HFR-Projektion in 60 Bildern pro Sekunde und Will Smith, der gegen sein digital verjüngtes Ebenbild kämpft, betreibt der Actionfilm technisch viel Aufwand. Das Seherlebnis ist jedoch bestenfalls komisch.
Von Daniel Pook

  1. Filmkritik Apollo 11 Echte Mondlandung als packende Kinozeitreise

SSD-Kompendium: AHCI, M.2, NVMe, PCIe, Sata, U.2 - ein Überblick
SSD-Kompendium
AHCI, M.2, NVMe, PCIe, Sata, U.2 - ein Überblick

Heutige SSDs gibt es in allerhand Formfaktoren mit diversen Anbindungen und Protokollen, selbst der verwendete Speicher ist längst nicht mehr zwingend NAND-Flash. Wir erläutern die Unterschiede und Gemeinsamkeiten der Solid State Drives.
Von Marc Sauter

  1. PM1733 Samsungs PCIe-Gen4-SSD macht die 8 GByte/s voll
  2. PS5018-E18 Phisons PCIe-Gen4-SSD-Controller liefert 7 GByte/s
  3. Ultrastar SN640 Western Digital bringt SSD mit 31 TByte im E1.L-Ruler-Format

  1. XC40 Recharge: Volvo kündigt Elektro-SUV an
    XC40 Recharge
    Volvo kündigt Elektro-SUV an

    Das erste Elektroauto unter der Marke Volvo kommt: Der schwedische Hersteller will ab 2020 ein erstes SUV mit Elektroantrieb bauen. Weitere sollen folgen.

  2. Google: Pixel 4 entsperrt auch bei geschlossenen Augen
    Google
    Pixel 4 entsperrt auch bei geschlossenen Augen

    Googles neue Pixel-4-Modelle haben keinen Fingerabdrucksensor mehr, sondern nur noch eine Gesichtsentsperrung. Diese basiert auf Infrarotwellen, was vermeintlich sicher ist - allerdings müssen die Augen des Nutzers nicht geöffnet sein, was ein Problem ist.

  3. Arbeitsspeicher: Gskill bringt DDR4-4000 mit scharfer CL15-Latenz
    Arbeitsspeicher
    Gskill bringt DDR4-4000 mit scharfer CL15-Latenz

    Hoher Takt und niedrige Latenz: Von Gskill kommt eine optimierte Version des Trident Z mit DDR4-4000 und CL15-16-16-18. Der Speicher eignet sich für schnelle CPUs wie den Core-i9-9900K oder den Ryzen 9 3900X.


  1. 16:42

  2. 16:17

  3. 15:56

  4. 15:29

  5. 14:36

  6. 13:58

  7. 12:57

  8. 12:35