1. Foren
  2. » Kommentare
  3. » Software-Entwicklung
  4. » Alle Kommentare zum Artikel
  5. » GPU-Programmierung: AMD…

OpenCL

Anzeige
  1. Thema

Neues Thema Ansicht wechseln


  1. OpenCL

    Autor bstea 15.06.11 - 19:11

    Ich hab' immer zwischen OpenCL und CUDA/Stream unterschieden, frag' mich ob das der Autor hier auch versteht.
    Ersteres hat das Ziel eine einfache gemeine Basis zu erstellen und Aufgaben von allen Recheneinheiten also auch GPU zu nutzen und letztere dienen zum ausschließlichen berechnen auf der Grafikkarte. Nebenbei wurde OpenCL auch mit Hilfe von AMD weiterentwickelt.

  2. Re: OpenCL

    Autor TheUltimateStar 15.06.11 - 22:06

    Hatte mich erst letzte Woche damit kurz beschäftigt, der Syntax von CUDA und OpenCL schien ja erstmal nicht sonderlich groß zu sein, auch das Drumherum wirkte ähnlich. Sofern es vom Hersteller beides einigermaßen unterstützt wird dürfte die Performance doch gleich sein, womit der Punkt bei mir erstmal an OpenCL ging.
    Okay, die erreichte Geschwindigkeit blieb weiter hinter den Erwartungen zurück, aber das schob ich mal auf mein mangelndes Detailwissen :D

  3. Re: OpenCL

    Autor pwn2own 16.06.11 - 00:03

    TheUltimateStar schrieb:
    --------------------------------------------------------------------------------
    > Okay, die erreichte Geschwindigkeit blieb weiter hinter den Erwartungen
    > zurück, aber das schob ich mal auf mein mangelndes Detailwissen :D

    Da magst du wohl recht haben. Bei GPGPU gbt es viele kleine Schräubchen und Zahnrädern, an denen man drehen kann/muss, damit es ordentlich läuft :)

  4. Re: OpenCL

    Autor TheUltimateStar 16.06.11 - 05:41

    pwn2own schrieb:
    --------------------------------------------------------------------------------
    > Da magst du wohl recht haben. Bei GPGPU gbt es viele kleine Schräubchen und
    > Zahnrädern, an denen man drehen kann/muss, damit es ordentlich läuft :)
    Als Informatiker gefallen einem diese viele Schräubchen ja eigentlich auch, hätte aber halt schon erwartet das ein Straight-Forward-Lösung zu mindestens erstmal eine solide Leistung erzielt. Luft zum Optimum wäre ja verständlich, aber das meine stupide SSE-Implementierung fast 10x so schnell ist spricht nicht für die Einsteigerfreundlichkeit des Frameworks. Wobei ich im Nachhinein aber auch denke dass das Problem auch nicht so gut auf die GPU passt, letztlich sollte da nur jedes Texel einer Luminenztexture mit einem Gewicht aus einem Float-Puffer multipliziert und aufaddiert werden. Dabei jedes Texel nur genau einmal zu lesen und quasi dazwischen nichts groß zu tun überfordert die Texelfetch-Units vielleicht, dem widerspricht nur ein wenig dass das Hinzufügen der Multiplikation mit den Gewichten nochmal im Vergleich zum reinen aufsummieren deutlich Zeit kostet. Aber da ich in der Zeit die zum synchronisieren zwischen OpenGL und OpenCL notwendig ist die Textur auch genauso gut in den Hauptspeicher kopiert habe war es letztlich halt sinnlos da weiter die ms zusammen zu suchen.

  5. Re: OpenCL

    Autor rayo 06.09.11 - 12:49

    Hallo

    Was mir zu deinem Problem gerade einfällt:
    - Float-Puffer muss am Anfang in den Shared Memory geladen werden (jeder Thread 1 Wert)
    - Jeder Thread sollte dann mehrere Werte in der Textur mit dem Puffer multiplizieren. Wenn N Threads laufen, sollte Thread 1 die Werte an Position ThreadID, ThreadID+N, ThreadId+2N, etc berechnen. Damit laden die einzelnen Threads die Daten sequentiell (was schneller ist)


    Also was zu beachten ist:
    - Shared memory ist für viele Zugriffe innerhalb einer WorkUnit schnell
    - Daten aus dem Global Memory immer Sequentiell laden
    - Nicht zu wenige Berechnungen pro Thread
    - Work Load der GPU sollte möglichst gross sein (limiterender Faktor könnte shared memory, register count, thread count, workload unit size sein)


    Gruss

Neues Thema Ansicht wechseln


Entschuldigung, nur registrierte Benutzer dürfen in diesem Forum schreiben. Klicken Sie hier um sich einzuloggen


Meistgelesen
  1. Libreoffice

    "Wir wollen Nutzer in die ODF-Welt ziehen"

  2. Browser

    Kauft Facebook Opera?

  3. Blackberry

    RIM plant Massenentlassungen

  4. Datenschutz

    Neue EU-Regeln zu Cookies treten in Kraft

  5. Samsung Galaxy S3

    Siri braucht sich nicht zu fürchten


Meistkommentiert
  1. Kommentare: 173 | letzter Beitrag 27.05. 23:42

  2. Kommentare: 94 | letzter Beitrag 26.05. 19:45

  3. Kommentare: 79 | letzter Beitrag 27.05. 22:43

  4. Kommentare: 71 | letzter Beitrag 27.05. 22:20

  5. Kommentare: 63 | letzter Beitrag 00:03 Uhr

Mehr



Haben wir etwas übersehen?

E-Mail an news@golem.de


Lollipop Chainsaw angespielt: Blond und brutal
Lollipop Chainsaw angespielt
Blond und brutal

Der japanische Spieldesigner Goichi Suda - Fans sagen schlicht "Suda 51" - ist für schräge Actionspiele bekannt. Sein nächstes Werk schickt ein scheinbar braves Schulmädchen in den Kampf gegen Zombies.

  1. Spielepublisher in Not dtp Entertainment meldet Insolvenz an
  2. US-Umsätze im März 2012 Spielemarkt schrumpft weiter
  3. Starlight Inception Lucas-Arts-Veteran kämpft für das Weltraum-Action-Genre

Samsung XE300: Google Chromebox versehentlich ausgeliefert
Samsung XE300
Google Chromebox versehentlich ausgeliefert

Weitgehend unbemerkt hat der US-Händler Tigerdirect die ersten Chromebox-Systeme von Google ausgeliefert. Für 330 US-Dollar bekommt der Nutzer recht gute Hardware in Nettop-Form, die sehr viel leistungsfähiger ist als die des Chromebook mit ChromeOS.

  1. Googles Aura Chromium OS mit klassischem Desktop

Bernd Schlömer: Twittern und Mailen für die Piratenpartei im Dienst verboten
Bernd Schlömer
Twittern und Mailen für die Piratenpartei im Dienst verboten

Der neue Chef der Piratenpartei steht im Verteidigungsministerium unter Druck. Elektronische Kommunikation für seine Partei ist ihm in der Dienstzeit untersagt. "Es gibt Leute im Ministerium, die darauf warten, dass ich Fehler mache", sagte Schlömer.

  1. Hartmut Semken Berliner Piratenparteichef tritt zurück
  2. Schulschwänzen Piratenpartei gegen elektronisches Klassenbuch
  3. Piratenpartei NRW "Wir bringen einen Schuss Chili ins Parlament"

  1. Renesas: Chiphersteller will ein Drittel der Beschäftigten loswerden
    Renesas
    Chiphersteller will ein Drittel der Beschäftigten loswerden

    Renesas ist nach Elpida der zweite schwer angeschlagene japanische Chiphersteller. Renesas, das Hitachi, Mitsubishi Electric und NEC gehört, macht Verlust und will seine größte Fabrik verkaufen.

  2. Blackberry: RIM plant Massenentlassungen
    Blackberry
    RIM plant Massenentlassungen

    RIM soll in den kommenden Tagen erneut einen massiven Stellenabbau ankündigen. "Ich habe herausgefunden, welche Teile ich in meinem Puzzle nicht mehr benötige", sagte Firmenchef Thorsten Heins.

  3. Browser: Kauft Facebook Opera?
    Browser
    Kauft Facebook Opera?

    Ein britisches Blog will erfahren haben, dass Facebook den norwegischen Browserhersteller Opera Software kaufen will. Beide Unternehmen wollen sich dazu nicht äußern.


  1. 15:41

  2. 13:23

  3. 14:48

  4. 14:29

  5. 14:24

  6. 12:30

  7. 12:23

  8. 18:49