-
Large Language Models
Autor: .02 Cents 18.01.24 - 09:55
Diese Artikel sind doch weitgehend hohl.
Diese KI genannten Large Language Models sind im Kern nichts anderes, als Plagiat-Generatoren. Es werden Texte synthetisiert basierend auf einer Datenbasis bereits vorhandener Texte.
Wieso ist es da eine Meldung wert, wenn dieses Modell für irgendwelche Tests / Prüfungen o.ä. besonders gut funktioniert? Ich weiss nicht genau, wie diese Mathe-Olympiade funktioniert. Wenn das an üblichen Prüfungen orientiert ist die in Schulen / Universitäten / Zertifikaten ... etc. verwendet werden, dann sind die Lösungen teil der Datenbasis. In dem Fall wäre es schlecht, wenn man dem Tool die Antworten auf alle Fragen vorher füttert, und es nur 25 von 30 Antworten produzieren.
Aber selbst wenn die Mathe Olympiade jedes Jahr neue Probleme neu formuliert - ich würde davon ausgehen, dass es sich um Probleme handelt, die grundsätzlich schon gelöst wurden und nicht die "grossen offenen Fragen der Mathematik" an denen sich viele Mathematiker seit langem die Zähne ausgebissen haben. In dem Fall sollte es immer noch in erster Linie eine Frage dessen sein, dass das / ein Paper in der "Suchdatenbank" enthalten ist, aus der die Antwort generiert wird.
Dass das Pattern Matching dieser Tools schon beeindruckend sein kann (insbesondere wenn sich auf die "good matches" konzentriert und false negatives / false positives u.ä. ignoriert) ist ja unbestritten. Dass auch der Synthese Teil oftmals gut verschleiern kann, aus welchen Quellen letztlich die Antwort genriert wird, dürfte auch mittlerweile nichts neues mehr sein.
Womit diese Generatoren aber vor allem Probleme haben - abgesehen davon, dass es sich um Plagiat-Engines handelt - sind komplexe inhaltliche Strukturen, wie Bezüge, Handelnde und deren Rollen über mehrere Sätze und Paragraphen hinweg etc. Je enger die erwartete Antwort ist, je weniger Quellen dafür herangezogen werden müssen, je einfacher muss es in so Modell in der Lage sein, eine Antwort zu generieren, einfach weil Kontext und Bezüge etc viel klarer sind.
Was beeindruckend wäre: Wenn diese Tools tatsächlich in der Lage wären, nicht nur Probleme zu lösen, zu denen es bereits eine Lösung gibt. Lösungen, die ohne Berücksichtigung von Urheber / Verwertungsrechten für die "Lösungssuche" herangezogen werden, oder die diese "Inputs" auch nur als Referenz anführen. Es gibt auf Youtube jede Menge von Videos zu ungelösten Mathematischen Problemen, und auch wenn das eine Plattform mit viel "Crack-Pot-Science" ist - einige davon sind vermutlich "real existierende Mathematische Probleme", die in diese Problemklasse fallen (Added Benefit: zumindest zu diesen Videos könnte Google über seine AGB hinreichend Rechte haben für die Verwendung in so einem Large Language Modell). Beeindruckend und etwas neues wäre es, wenn Google AI zu solchen Problemen eine Antwort liefern würde und nicht nur zu Problemen, die ohnehin schon gelöst sind. -
Re: Large Language Models
Autor: dplaia 18.01.24 - 10:30
DeepMind hat doch bereits gezeigt (suche nach "DeepMind FunSearch)", dass LLMs auch Lösungen für mathematische Probleme finden kann, die der Menschheit bisher unbekannt waren, d.h. die Lösung waren nicht in den Trainingsdaten vorhanden.
LLMs sind viel beeindruckender, als die meisten (auch Machine Learning Experten) glauben. -
Re: Large Language Models
Autor: magnolia 18.01.24 - 10:38
Schöne Wünsche!
Aber dorthin kommen wir nur in kleinen Schritten. Und jeden Schritt ist es mir eine Meldung wert. (Dank an golem.de)
Vor 18 Jahren war ich überzeugt, dass meine frisch geborene Töchter in Ihren Leben kein Führerschein brauen werde, weil Autos schon damals Autonom fahren könnten. Und heute sind wir deutlich näher diese Vision, aber es werden noch viele Schritte machen müssen. -
Re: Large Language Models
Autor: TheUnichi 18.01.24 - 18:58
.02 Cents schrieb:
--------------------------------------------------------------------------------
> Diese Artikel sind doch weitgehend hohl.
>
> Diese KI genannten Large Language Models sind im Kern nichts anderes, als
> Plagiat-Generatoren. Es werden Texte synthetisiert basierend auf einer
> Datenbasis bereits vorhandener Texte.
Sage mir, dass du ChatGPT nie verwendet hast ohne mir zu sagen, dass du ChatGPT nie verwendet hast.
Die generative KI kann z.B. Code oder Formelsammlungen verstehen und generieren, kann diesen Code mit dem passenden Interface auch ausführen (ChatGPT Code Analysis), kann Websuchen starten und aktuelle Inhalte zuhilfe ziehen (ChatGPT Bing Search), kann Bilder und Dateien verarbeiten und analysieren.
Du unterschätzt, wie weit man mit generativen Modellen kommt. Wenn es ausführbaren Code generiert, kann es auch "rechnen", offensichtlich.



