-
Maschinelles Lernen: Random Forests - Wichtigkeit von Variablen
Autor: Kimmy1994 01.11.18 - 16:02
Hey ihr Lieben,
seit geraumer Zeit interessiere ich mich für Entscheidungsbäume und Random Forests. Gerade bei Random Forests habe ich das Gefühl, dass es schwer ist, ausführliche Erklärungen zu manchen Themengebieten zu finden.
Ich würde mich sehr freuen, falls mir jemand nachfolgende Frage beantworten kann. :-)
Und zwar geht es um die Wichtigkeitsschätzung von Variablen. Ich habe gelesen, dass man die Wichtigkeit eines Attributs auf zwei verschiedene Arten bestimmen kann. Zum einen über den Gini-Koeffizienten und zum anderen über ein Signifikanzniveau.
Beim Signifikanzniveau wird scheinbar der Durchschnitt (:= D) der verlorenen Stimmen sowie die Standard-Abweichung (:= S) bestimmt. Dann wird Z = D/(S/sqrt(B)) berechnet, wobei B für die Anzahl der Bäume im Wald steht. Von diesem Wert Z soll dann unter der Normalverteilungsannahme die Signifikanz bestimmt werden.
Sofern das bisherige korrekt ist: Kann mir evtl. jemand sagen oder einen Tipp geben, wie ich die Signifikanz einer einzigen Zahl (Ohne gegebene Varianz oder Erwartungswert) bestimmen kann?
Ich bin jeder einzelnen Nachricht sehr dankbar.
Liebe Grüße
Kimmy -
Re: Maschinelles Lernen: Random Forests - Wichtigkeit von Variablen
Autor: Abdiel 02.11.18 - 08:19
Sie befinden sich hier... "Raumfahrt: Video zeigt, wie Sojus MS-10 verloren ging" ;-)



