1. Foren
  2. Kommentare
  3. Internet-Forum
  4. Alle Kommentare zum Artikel
  5. › Alpha Go: Die nächste…

Was macht dieses Neuronale Netz anders?

  1. Thema

Neues Thema


  1. Was macht dieses Neuronale Netz anders?

    Autor: Klausens 15.03.16 - 16:18

    ...als wenn ich (rein theoretisch) FANN nehm und die hidden Layer auf X-Tausend stell?

    Gibt's dazu Erklärungen für einen, der schon mal was von einem neuronalen Netz gehört hat, aber kein Experte ist?



    1 mal bearbeitet, zuletzt am 15.03.16 16:19 durch Klausens.

  2. Re: Was macht dieses Neuronale Netz anders?

    Autor: STSchiff 15.03.16 - 16:31

    Alpha-Go ist ja erst so stark geworden, nach dem das Haupt-Neuronale Netz ('Policy Network') um weitere Netze erweitert wurde, die Züge schneller und besser bewerten können. Gibt einige Interviews mit den Deep-Mind enticklern darüber ;)

  3. Re: Was macht dieses Neuronale Netz anders?

    Autor: Klausens 15.03.16 - 16:42

    Das wär dann das Nächste, was ich nicht versteh. Wie kann man ein neuronales Netz trainieren, dass es Züge bewerten kann.
    Man müsste ja zu jedem Zug beim Lernen ein gut/schlecht haben, was wohl nicht der Fall sein wird.
    Was ich mir noch vorstellen könnte ist den aktuellen Punktestand im Spiel auszuwerten und anzunehmen, dass dafür wohl maßgeblich die letzten X Züge davor verantwortlich sind. Dann hätte man sowas wie eine Zugbewertung mit der man das Netz trainieren kann.

  4. Re: Was macht dieses Neuronale Netz anders?

    Autor: wurfkeks 15.03.16 - 16:55

    Hier findest du eine Veröffentlichung zu AlphaGo: http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html

    Ich bin selbst noch nicht zum Lesen gekommen, kann daher nicht sagen, wie aussagekräftig sie bezüglich deiner Fragen ist.

  5. Re: Was macht dieses Neuronale Netz anders?

    Autor: xxsblack 15.03.16 - 18:19

    Vielleicht erklärt dir die Erklärung bei Spon ein wenig. (Neuronale Netzwerke: Die Geschichte, findest du schon :D )

    SPON - AlphaGo besiegt Lee Sedol mit 4zu1

  6. Re: Was macht dieses Neuronale Netz anders?

    Autor: Makatu 15.03.16 - 20:27

    Klausens schrieb:
    --------------------------------------------------------------------------------
    > Was ich mir noch vorstellen könnte ist den aktuellen Punktestand im Spiel
    > auszuwerten und anzunehmen, dass dafür wohl maßgeblich die letzten X Züge
    > davor verantwortlich sind. Dann hätte man sowas wie eine Zugbewertung mit
    > der man das Netz trainieren kann.

    Wenn ich es recht verstanden habe, wird am Ende jeder Partie der Spielgewinn oder -verlust über alle Züge zurückpropagiert und beinflussst dadurch (minimal) das Gewicht jedes Zuges positiv oder negativ.

  7. Re: Was macht dieses Neuronale Netz anders?

    Autor: der_wahre_hannes 16.03.16 - 11:01

    Klausens schrieb:
    --------------------------------------------------------------------------------
    > Das wär dann das Nächste, was ich nicht versteh. Wie kann man ein
    > neuronales Netz trainieren, dass es Züge bewerten kann.
    > Man müsste ja zu jedem Zug beim Lernen ein gut/schlecht haben, was wohl
    > nicht der Fall sein wird.

    Ganz vereinfacht läuft es so ab: Es werden ausgehend von der aktuellen Stellung mögliche Züge simuliert (so ganz stecke ich im Thema auch nicht drin, aber ich meine, es war randomisiert). Gewinnt ein Zug in diesen Simulationen besonders häufig, so ist es ein guter Zug. Ein Zug, der besonders häufig verliert, ist ein schlechter Zug.

  8. Re: Was macht dieses Neuronale Netz anders?

    Autor: Komischer_Phreak 17.03.16 - 16:00

    der_wahre_hannes schrieb:
    --------------------------------------------------------------------------------

    > Ganz vereinfacht läuft es so ab: Es werden ausgehend von der aktuellen
    > Stellung mögliche Züge simuliert (so ganz stecke ich im Thema auch nicht
    > drin, aber ich meine, es war randomisiert). Gewinnt ein Zug in diesen
    > Simulationen besonders häufig, so ist es ein guter Zug. Ein Zug, der
    > besonders häufig verliert, ist ein schlechter Zug.

    Damit beschreibst Du eigentlich den α-β-Pruning-Algorithmus. Darauf kann es nicht aufbauen, denn das ist bei Go rechnerisch einfach nicht zu schaffen - zu viele mögliche Züge.

  1. Thema

Neues Thema


Um zu kommentieren, loggen Sie sich bitte ein oder registrieren Sie sich. Sie müssen ausserdem in Ihrem Account-Profil unter Forum einen Nutzernamen vergeben haben. Zum Login

Stellenmarkt
  1. (Senior) Solution Architect - Dynamics 365 / Power Platform (*)
    ista SE, Essen
  2. Sachgebietsleiter (m/w/d) Business Development & Evaluation
    Mainova AG, Frankfurt am Main
  3. Application Manager (w/m/d)
    ING Deutschland, Frankfurt am Main
  4. Application Manager:in (m/w/d)
    STRABAG BRVZ GMBH & CO.KG, Köln

Detailsuche


Golem pur
  • Golem.de ohne Werbung nutzen

Anzeige
Spiele-Angebote
  1. 219,99€ (mit Vorbesteller-Preisgarantie)
  2. basierend auf Verkaufszahlen


Haben wir etwas übersehen?

E-Mail an news@golem.de