1. Foren
  2. Kommentare
  3. Wissenschaft
  4. Alle Kommentare zum Artikel
  5. › Diskriminierung: KI ist nur so…

Das Grundprinzip von überwachtem ML

  1. Thema

Neues Thema Ansicht wechseln


  1. Das Grundprinzip von überwachtem ML

    Autor: Thargon 11.06.20 - 18:07

    Vorweg: Wie so häufig wird in dem Artikel KI mit überwachtem Lernen gleichgesetzt, was von Grund auf völlig falsch ist. Überwachtes Lernen ist nur ein Teilbereich der (schwachen) KI - auch wenn das viele Hype-ster gerne vergessen.

    Also wir funktioniert überwachtes Lernen eigentlich?
    Ob (Tiefes) Neuronales Netz, Support Vector Machine, etc. Das Grundprinzip ist immer gleich und extrem simpel: Trainiert wird mit Datenpaaren, welche aus Eingangs- und Ausgangs-Signal bestehen. Im Optimalfall können dann für neue, bislang unbekannte Eingangsdaten korrekte Asugangssignale generiert werden.
    Aber wie können Entwickler den testen, ob das tatsächlich so ist?
    Ganz einfach indem man weitere bekannte Datenpaare benutzt um zu schauen, wie stark die generierte Ausgabe von der erwarteten abweicht.

    Die eigentlich Crux dabei liegt so gut wie immer in den Daten. Einen 100%ig repräsentativen Datensatz gibt es nicht. (Also genau genommen schon: Das nennt sich dann Datenbank und kann völlig anders - nämlich deterministisch - verarbeitet werden.) Gute Datensätze unterscheiden ich insofern von schlechten, als dass der systematische Fehler in den Daten möglichst gering ist. In jedem Fall macht man jedoch prinzipbedingt bei überwachtem Lernen einen Fehler - nämlich eben den, der in den Daten steckt. Hinzu kommt, dass die Qualität eines trainierten Systems immer anhand von Beispielen aus dem Trainingsdatensatz gemessen wird.
    Halt mal, die Testdaten müssen aber doch unbekannt sein, dürfen somit nicht fürs Training verwendet worden sein!
    Dieses Problem umgeht man mittels Cross-Validation, wobei - vereinfacht gesagt - ein Teil des Datensatzes beim Training zurückgehalten wird, um ihn eben später zur Validierung verwenden zu können.
    Wieso fallen systematische Fehler wie Diskriminierung bei solchen Tests nicht auf?
    Weil die Fehler nicht im Algorithmus oder bei den Entwicklern liegen, sondern in den Daten. Systematische Fehler sind damit sowohl in den Trainings- als auch den Testdaten enthalten, wodurch man sie nicht finden kann.

    Worauf will ich mit dieser Nachhilfestunde eigentlich hinaus?
    Der Artikel suggeriert, dass Entwickler im Bereich KI rassistisch und frauenfeindlich sind und daher entsprechende Systeme entwickeln. Das völliger Quatsch! Diese Menschen sind genauso gut oder schlecht wie alle anderen auch. Aufgrund des höheren Bildungsgrades statistisch vermutlich sogar eher auf der guten Seite.
    Das bedeutet nicht, dass man nicht mehr Diversität fördern sollte. Alleine die statistische Korrelation zwischen sozialem Status und Ethnie sollte hierfür Argument genug sein. Bunt gemischte Entwicklerteams können aber einen rassistischen Datensatz nicht weniger rassistisch machen. Wenn beispielsweise Arbeitgeber weiterhin nach der Prämisse "dunkle Haut = doofes Hirn" agieren und man aus deren Verhalten einen Datensatz erstellt, dann ist an dieser Stelle schon nichts mehr zu retten.

    Und wie kann man das Problem lösen?
    Die Frage kann ich nicht beantworten. Womit ich mir allerdings ziemlich sicher bin: Mit überwachten Lernverfahren wird man das Problem nicht lösen können.

  2. Re: Das Grundprinzip von überwachtem ML

    Autor: GwhE 11.06.20 - 19:18

    Sehr schön zusammengefast.

    Von meiner seite eventuell noch der hinweis, das problem ist in der statistik schon sehr lange bekannt. Und wird auch in den büchern von asimov sozial kritisch behandelt.

    Was ist das neue an AI/ML, es werden nichtlineare verfahren benutzt um ein minimum in den daten zu finden. Nicht mehr und nicht weniger.

    Und dann nochmal was zum angeblichen rassismuss, wenn ich einen algorithmus entwerfe der eine statistische aussage macht, werde ich immer false positives und true negatives haben. Wenn ich mir diese Fehler anschaue werde ich immer ein merkmal finden, das es von der maße unterscheidet, sprich einer minderheit angehört.

  3. Re: Das Grundprinzip von überwachtem ML

    Autor: Hotohori 11.06.20 - 20:24

    Ist natürlich auch ein Problem, die Erwartungshaltung der Menschen was die KI leisten soll und dabei völlig an der Realität vorbei denken. Eine Minderheit ist eine Minderheit, ob das der Mensch nun wahr haben will oder nicht spielt keine Rolle. Eine KI ist immer 100% ehrlich, was der Mensch nie ist.

  1. Thema

Neues Thema Ansicht wechseln


Um zu kommentieren, loggen Sie sich bitte ein oder registrieren Sie sich. Sie müssen ausserdem in Ihrem Account-Profil unter Forum einen Nutzernamen vergeben haben. Zum Login

Stellenmarkt
  1. Agile Software-Tester (m/w/d)
    TOPdesk Deutschland GmbH, Kaiserslautern
  2. Technischer Mitarbeiter für Konzeption und Qualitätssicherung (m/w/d) Bereich Produktentwicklung, Abteilung Kassensoftware
    ADG Apotheken-Dienstleistungsgesellschaft mbH, Mannheim
  3. IT-Anwendungsbetreuer*in eGovernment (m/w/d)
    Landeshauptstadt Stuttgart, Stuttgart
  4. Product Owner (m/w/d) Vertriebsteam
    Lebensversicherung von 1871 a. G. München, München

Detailsuche


Golem pur
  • Golem.de ohne Werbung nutzen

Anzeige
Hardware-Angebote
  1. 499,99€
  2. (reduzierte Überstände, Restposten & Co.)


Haben wir etwas übersehen?

E-Mail an news@golem.de