1. Foren
  2. Kommentare
  3. Politik/Recht
  4. Alle Kommentare zum Artikel
  5. › Leistungsschutzrecht: Wie die VG…

Nicht maschinenlesbar?

  1. Thema

Neues Thema Ansicht wechseln


  1. Nicht maschinenlesbar?

    Autor: colorando 03.03.15 - 17:33

    Das ich nicht lache: Einmal einen Regex ausgetüftelt für https://www.vg-media.de/de/alle-wahrnehmungsberechtigte.html und schon ist die ganze Sache maschinenlesbar. Soll natürlich nicht heißen, dass ich diese vg-media gut finde.

  2. Re: Nicht maschinenlesbar?

    Autor: smurfy 03.03.15 - 18:00

    Ja, eine RegEx - Regel für das parsen der Einträge/Verlage ist nicht schwer. Aber jetzt stell dir mal vor, die VG-Media würde sich eines Tages entscheiden, die HTML-Struktur zu ändern. Einfach nur der Darstellung wegen. Aus eigener Erfahrung weiß ich nur zu gut, wie schnell RegEx-Regeln nicht mehr greifen, sobald an der Struktur etwas geändert wird. Natürlich kann man die Regeln dann wieder anpassen. Aber würdest du als Suchmaschinenbetreiber wirklich das Risiko eingehen, dich auf deine RegEx-Regeln zu verlassen und dafür in Kauf zu nehmen, dass dich die VG-Media verklagt, weil du erst nach 2-3 Tagen gemerkt hast, dass deine Regeln nicht mehr greifen? Ein Meldung des Parsers, dass er beim parsen der Seite keine Einträge gefunden hat, wäre zwar hilfreich aber nicht praktisch.

    Also ich würde mich als Suchmaschinenbetreiber auch lieber auf ein definiertes Datenformat verlassen als auf irgendwelche RegEx-Regeln. Denn einen Grund das Datenformat zu ändern gibt es weitaus weniger, als einen Grund die Darstellung auf der Seite zu ändern. Vor allem weil es ja auch nur eine einfache Auflistung ist, und keine komplexe Datenstruktur. Wenn nicht die Gefahr bestünde, verklagt werden zu können, dann wäre das etwas anderes. Aber so... RegEx? Nein, Danke.



    1 mal bearbeitet, zuletzt am 03.03.15 18:01 durch smurfy.

  3. Re: Nicht maschinenlesbar?

    Autor: crash 03.03.15 - 19:21

    Also ehrlich, HTMl parst man mit einem HTML/DOM-Parser! Klar geht das auch kaputt, aber mit einem cleveren CSS- oder XPath-Regel ist das wesentlich robuster. Schreibt man sich noch einen Integrationstest der Prüft ob Ergebisse zurückkommen.

    Wenn man das ganze mit Github und TravisCI verbindet kann man die Erstellung der Liste auch automatisieren.



    1 mal bearbeitet, zuletzt am 03.03.15 19:27 durch crash.

  4. Re: Nicht maschinenlesbar?

    Autor: tingelchen 03.03.15 - 19:39

    An anderer Stelle wurde bereits geschrieben, das die Liste, die hier angeführt wurde, nicht die vollständige Liste ist. Damit kannst du da soviel drauf rum parsen bis deine elkos dick und fett sind. Du würdest dennoch ein nettes Schreiben vom Anwalt bekommen, mit der Aufforderung zum Schadensersatz.

    Dazu kommt. Ja, es ist HTML. Und ja.. HTML kann man mit Regex, diversen Bash Tools oder einem DOM-Script parsen. Aber alle diese Tools gehen ratz fatz den Bach runter, wenn sich die Struktur der Datei ändert.

  5. Re: Nicht maschinenlesbar?

    Autor: tezmanian 03.03.15 - 22:14

    Mal ernsthaft, wieso sollen die anderen die Aufgabe der VG Media übernehmen?

  6. Re: Nicht maschinenlesbar?

    Autor: elgooG 09.03.15 - 11:19

    Eben und was hier wohl einige vergessen: Man kann die Daten zwar maschinell parsen, aber die Rechtsunsicherheit ist beim Ausleser und nicht bei VG Media. Fehler können schnell Geld kosten oder den Ruin bedeuten. Ständige manuelle Kontrolle ist damit auch beim automatischen Auslesen erforderlich.

    Stellt die VG Media dagegen eine Datei im brauchbaren Format zur Verfügung, ist das was sich in der Datei befindet rechtens und Fehler in dieser Datei müssend dann von VG Media und nicht vom Seitenbetreiber verantwortet werden.

    Wieso keine Datei angeboten wird? Weil die mit dem von VG Media diktierten und korrupten Politikern umgesetzte Leistungsschutzrecht genau die Rechtsunsicherheit erzeugt hat die man wollte. Google wurde besänftigt und generiert fleißig Klicks und die vielen kleinen Anbieter zahlen aus Angst oder geben früher oder später auf. Der Plan Google zu Klicks und Zahlung zu zwingen, ging schief, aber man kann immer noch fett abkassieren. Der Markt wird kontrolliert und ausgebeutet. Ob das der Wirtschaft Schaden zufügt ist sowohl der VG Media als auch den bestochenen Politikern herzlich egal. Es geht um den eigenen Profit, mehr nicht.

    Kann Spuren von persönlichen Meinungen, Sarkasmus und Erdnüssen enthalten. Ausdrucke nicht für den Verzehr geeignet. Ungelesen mindestens haltbar bis: siehe Rückseite

  1. Thema

Neues Thema Ansicht wechseln


Um zu kommentieren, loggen Sie sich bitte ein oder registrieren Sie sich. Sie müssen ausserdem in Ihrem Account-Profil unter Forum einen Nutzernamen vergeben haben. Zum Login

Stellenmarkt
  1. Technische Informationsbibliothek (TIB), Hannover
  2. Universität Potsdam, Potsdam
  3. Merz Pharma GmbH & Co. KGaA, Frankfurt am Main
  4. Equip GmbH, Wien (Österreich)

Golem pur
  • Golem.de ohne Werbung nutzen

Anzeige
Hardware-Angebote
  1. täglich neue Deals bei Alternate.de
  2. (reduzierte Überstände, Restposten & Co.)


Haben wir etwas übersehen?

E-Mail an news@golem.de


UX-Designer: Computer sind soziale Akteure
UX-Designer
"Computer sind soziale Akteure"

User Experience Designer schaffen positive Erlebnisse, wenn Nutzer IT-Produkte verwenden. Der Job erfordert Liebe zum Detail und den Blick fürs große Ganze.
Ein Porträt von Louisa Schmidt

  1. Coronapandemie Viele IT-Freelancer erwarten schlechtere Auftragslage
  2. IT-Fachkräftemangel Es müssen nicht immer Informatiker sein
  3. Jobporträt IT-Produktmanager Der Alleversteher

Norbert Röttgen: Kandidat für CDU-Vorsitz streut alternative Fakten zu 5G
Norbert Röttgen
Kandidat für CDU-Vorsitz streut alternative Fakten zu 5G

In der explosiven Situation zwischen den USA und China zündelt Norbert Röttgen, CDU-Politiker mit Aspirationen auf den Parteivorsitz und die Kanzlerschaft, mit unrichtigen Aussagen zu 5G und Huawei.
Eine Analyse von Achim Sawall

  1. Handelskrieg Australiens Regierung greift Huawei wegen Rechenzentrum an
  2. 5G Verbot von Huawei in Deutschland praktisch ausgeschlossen
  3. Smartphone Huawei gehen die SoCs aus

8Sense im Test: Vibration am Kragen gegen Schmerzen im Rücken
8Sense im Test
Vibration am Kragen gegen Schmerzen im Rücken

Das Startup 8Sense will mit einem Ansteckclip einer Bürokrankheit entgegenwirken: Rückenschmerzen. Das funktioniert - aber nicht immer.
Ein Test von Oliver Nickel

  1. Rufus Cuff Handgelenk-Smartphone soll doch noch erscheinen
  2. Fitnesstracker im Test Aldi sportlich abgeschlagen hinter Honor und Mi Band 4