1. Foren
  2. Kommentare
  3. Wirtschaft
  4. Alle Kommentare zum Artikel
  5. › In eigener Sache: Golem.de erhält…

Wie viele Ebenen werden diese Auszüge haben?

Neue Foren im Freiraum! Raumfahrt und freie Software haben jetzt einen Platz, die Games tummeln sich jetzt alle in einem Forum.
  1. Thema

Neues Thema Ansicht wechseln


  1. Wie viele Ebenen werden diese Auszüge haben?

    Autor: ThaKilla 24.02.16 - 19:28

    Ich finde die Idee sehr gut.

    Generell wünsche ich mir sogar eine Art Kaskadierung um sich immer tiefer in bisher unbekannte bzw. vernachlässigte Themen einarbeiten zu können. Ideal wäre es wenn man aus einem Artikel mit zwei Absätzen, ein mehrere Seiten starkes Manuskript aufklappen könnte.

    Jedoch frage ich mich, wie genau diese automatischen relevanten Informationen zu den Artikeln passen werden.
    Was ich mir definitiv nicht wünsche ist, dass alles vorgeschlagen wird was nur im entferntesten mit dem Namen einer Firma und/oder eines Produktes zu tun hat. Also keine im Artikel integrierte Googlesuche, sondern tatsächlich relevante Erweiterungen, welche dann gerne auch, wie oben erwähnte Kaskadierung, über am liebsten beliebige ebenen verfügt.

    Dafür würde ich sofort ein Abo abschließen.

  2. Re: Wie viele Ebenen werden diese Auszüge haben?

    Autor: am (golem.de) 24.02.16 - 20:05

    > Generell wünsche ich mir sogar eine Art Kaskadierung um sich immer tiefer
    > in bisher unbekannte bzw. vernachlässigte Themen einarbeiten zu können.
    > Ideal wäre es wenn man aus einem Artikel mit zwei Absätzen, ein mehrere
    > Seiten starkes Manuskript aufklappen könnte.
    In diese Richtung soll es auch gehen.

    > Jedoch frage ich mich, wie genau diese automatischen relevanten
    > Informationen zu den Artikeln passen werden.
    Wir uns auch. Eines der Ziele des Projektes ist es, herauszufinden, ob es mit vertretbaren Mitteln möglich ist, eine angemessene Qualität zu erreichen ist. Im Gegensatz zu einer Uni können wir das Problem nicht mit unbegrenzt Hardware und Zeit zu erschlagen.

    Grüße,
    Alexander Merz (golem.de)

  3. Re: Wie viele Ebenen werden diese Auszüge haben?

    Autor: Tigtor 25.02.16 - 06:56

    Nur Interesse halber: muss dabei auch ein funktionierendes Produkt herauskommen oder kann/darf das Projekt auch scheitern?

    Am einfachsten wäre natürlich entsprechende Absätze per keyword zu Flaggen, aber das ist ja nicht Sinn der Sache und würde auch für alte Artikel nicht funktionieren. Ich könnte mir vorstellen, dass es möglich wäre alte Artikel zu analysieren und einzelne Abschnitte auf keywords zu analysieren ( Google hat diese Technik ja schon selbst verwendet ) d.h. Häufigkeit und ggf. Zusammenhang mit anderen key words im selben Abschnitt oder Satz.

    Und dann dem Benutzer beim Auftreten dieser key words in anderen Artikeln die Option zu liefern bestehend Artikelabschnitte einzublenden ( Starship troopers - erfahren sie mehr XD )
    Allerdings sollte man dem Benutzer eine Auswahl geben damit dieser selbst entscheiden kann, welcher der Inhalte für ihn relevant ist.

    So dawn goes down to day.
    Nothing gold can stay.

  4. Re: Wie viele Ebenen werden diese Auszüge haben?

    Autor: am (golem.de) 25.02.16 - 12:50

    > Nur Interesse halber: muss dabei auch ein funktionierendes Produkt
    > herauskommen oder kann/darf das Projekt auch scheitern?
    Scheitern ist eine Option.
    Das Warum werden wir in dem Fall ausführlich schildern.

    > Am einfachsten wäre natürlich entsprechende Absätze per keyword zu Flaggen,
    > aber das ist ja nicht Sinn der Sache und würde auch für alte Artikel nicht
    > funktionieren.
    Das würde auch bei neuen Artikel nicht funktionieren, da dass manuelle Verschlagworten auf Absatzebene unglaublich Zeit kostet.

    > Ich könnte mir vorstellen, dass es möglich wäre alte Artikel
    > zu analysieren und einzelne Abschnitte auf keywords zu analysieren ( Google
    > hat diese Technik ja schon selbst verwendet ) d.h. Häufigkeit und ggf.
    > Zusammenhang mit anderen key words im selben Abschnitt oder Satz.
    Ja, in diese Richtung laufen unsere Ideen. Die Schwierigkeit besteht darin, abzuklopfen in wie weit bestehende Technik tatsächlich mit dem Fachvokabular und zuweilen kryptischen Produktbezeichnungen auf Golem.de klar kommt. Wenn die Technik einen Intel i3 und einen Intel i7 zusammenwirft oder nicht unterscheiden kann zwischen einer Matrox-450-Grafikkarte und einer Mali-450-GPU, dann wird das nix.

    Grüße,
    Alexander Merz (golem.de)

  5. Re: Wie viele Ebenen werden diese Auszüge haben?

    Autor: Ext3h 25.02.16 - 18:28

    Da sehe ich Probleme die deutlich über das bloße abstimmen von Stichwörtern hinaus geht.

    Das Problem ist, dass die Absätze zwar häufig ein paar gut erkennbare Begriffe aufweisen die einen Kontext geben sollen, dafür dann aber zum einen zu viele, und zum anderen ergeben sich die interessanten Zusammenhänge erst aus dem Kontext.

    Den zu extrahieren dürfte schwierig werden - es sei denn ihr gebt diesen beim verfassen des Artikels bereits explizit formal an. Der Hauptfokus sollte dabei darauf liegen zu unterscheiden welche Art von Hintergrundinformationen relevant sind.

    Begriffsklärung? Liste von historischen Ereignissen für einen zeitlichen Kontext? Verwandte Hintergrundinformation?

    Im Endeffekt würde man dann für diese 3 Kategorien jeweils neue Absätze entsprechend tragen, wobei tags gruppiert werden und die Länge des sets ausdrückt wie spezifisch die information ist.

    Per default würde dann versucht auf verwandte Informationen zu verlinken. Sprich größte Übereinstimmung pro Set. Welche Art von information Präzedenz haben sollte hängt von der Art des aktuellen Absatz ab. Eine Begriffserklärung wird sehr wahrscheinlich weitere erfordern, ein zeitlicher Kontext wird primär nach weiteren Ereignissen erfordern. Aus beiden kann, aber muss nicht, ein bereits auf verwandte Informationen relevant sein.

    Begriffe die ein Absatz zwar referenziert, aber nicht selber behandelt müssen per query annotiet werden, optional mit einem Hinweis welche Art von information in den Kontext passen wurde.

    Zur Verbesserung, bzw Verbreiterung des Suchraum sollten Begriffe außerhalb (!) des Artikels mit Parent-Child-Relationen verlinkt werden. Geschwister eines Begriffs sind durchaus ebenfalls interessant. Zudem gibt es dem Autor bei der Auswahl der Begriffe einen Kontext, und reduziert damit das Risiko von Bedienfehlern. Neben Parent-Child auch noch Aliasse, so das synonyme Begriffe für den Autor alle verwendbar sind ohne die DB auf zu blähen.


    Vergesst es die Bestandsdaten per NLP sortieren zu wollen, das wird nicht funktionieren. Stellt lieber eueren Autoren eine funktionierende Autovervollständigung für die DSL zur Verfügung, da bekommt ihr deutlich bessere Daten raus. Selbst im englischen, mit den eher kurzen Sätzen funktioniert NLP schon eher schlecht als recht, aber im deutschen mit den Schlangensätzen und den doch teilweise schwierigen Sprachkonstrukten wie zusammengesetzten Wörtern oder eingedeutschten begriffen funktioniert das überhaupt nicht.

    PS: Mit simplen abgleichen von automatisch extrahierten Stichwörtern würdet ihr zwar tolles SEO betreiben, aber für den menschlichen Leser der neben einer thematischen Übereinstimmung auch einen strukturierten Lesefluss erwartet taugt das absolut nichts.



    2 mal bearbeitet, zuletzt am 25.02.16 18:41 durch Ext3h.

  1. Thema

Neues Thema Ansicht wechseln


Um zu kommentieren, loggen Sie sich bitte ein oder registrieren Sie sich. Sie müssen ausserdem in Ihrem Account-Profil unter Forum einen Nutzernamen vergeben haben. Zum Login

Stellenmarkt
  1. Full Stack Developer:in Web-Applikation (m/w/d)
    Haufe Group, Freiburg im Breisgau, Hannover
  2. Informatiker im EDI Software Support (m/w/d)
    IWOfurn Service GmbH, Holzgerlingen (Home-Office)
  3. SAP HCM Senior Berater (m/w/x)
    über duerenhoff GmbH, Haßfurt
  4. Datenbankentwickler:in (m/w/d)
    Kassenärztliche Vereinigung Schleswig-Holstein, Bad Segeberg

Detailsuche


Golem pur
  • Golem.de ohne Werbung nutzen

Anzeige
Spiele-Angebote
  1. 28,99€
  2. 9,99€


Haben wir etwas übersehen?

E-Mail an news@golem.de


Raumfahrt: Braucht es Kernkraft für den Flug zum Mars?
Raumfahrt
Braucht es Kernkraft für den Flug zum Mars?

In den USA werden wieder nukleare Raketentriebwerke für Mars-Reisen entwickelt. Aber wie funktionieren sie und wird Kernkraft dafür überhaupt benötigt?
Von Frank Wunderlich-Pfeiffer

  1. Astronomie Flüssiges Wasser auf dem Mars war wieder ein Irrtum
  2. Raumfahrt Rocketlab baut zwei Marssonden für die Nasa
  3. Raumfahrt Mars-Hubschrauber Ingenuity gerät ins Trudeln

Elektronische Patientenakte: Ganz oder gar nicht
Elektronische Patientenakte
Ganz oder gar nicht

Zwischen dem Bundesdatenschutzbeauftragten und den Krankenkassen bahnt sich ein Rechtsstreit über die elektronische Patientenakte an.
Von Christiane Schulzki-Haddouti

  1. Spiegel, Zeit, Heise Datenschutzverein geht gegen Pur-Abos vor
  2. Daten gegen Service EuGH soll über Facebooks Geschäftsmodell entscheiden
  3. DSGVO Datenschützer will "Cookie-Banner-Wahnsinn" beenden

Corona und IT: Arbeiten ganz ohne Geschäftsreisen
Corona und IT
Arbeiten ganz ohne Geschäftsreisen

Für manche in der IT mag er ein Segen sein, für andere ist er projektgefährdend: der coronabedingte Wegfall von Geschäftsreisen.
Ein Erfahrungsbericht von Boris Mayer