1. Foren
  2. » Kommentare
  3. » Software-Entwicklung
  4. » Alle Kommentare zum Artikel
  5. » Doppelganger: Uberblic…

YQL

Anzeige
  1. Thema

Neues Thema Ansicht wechseln


  1. YQL

    Autor efwoieufhliue 16.08.11 - 15:47

    Schon jemand getestet was die Vorteile/Unterschiede gegenüber YQL (Yahoo Query Language) sind?
    http://developer.yahoo.com/yql/

  2. Re: YQL

    Autor SharpCommenter 16.08.11 - 16:01

    efwoieufhliue schrieb:
    --------------------------------------------------------------------------------
    > Schon jemand getestet was die Vorteile/Unterschiede gegenüber YQL (Yahoo
    > Query Language) sind?
    > developer.yahoo.com

    Wenn ich es richtig verstehe, dann sind das zwei verschiedene Paar Schuhe. YQL ist schon um einiges komplexer.

    Doppelganger scheint wohl einfach nur ein Verzeichnis von IDs/PrimaryKeys für verschiedene WebServices zu sein. Nach dem Muster:
    Anstatt bei zehn Diensten einzeln eine Suchanfrage nach der ID für Berlin zu stellen und dann erst sich die Daten zu Berlin holen zu können, stellt man eine einzelne Suchanfrage an Doppelganger mit dem Ort und bekommt dann alle IDs, mit denen man bei den anderen Diensten die Daten holen kann. Das spart 9 Requests und im Idealfall lässt sich das Daten-Abholen parallelisieren, wodurch ein weiterer Vorteil entsteht (sonst liesse es sich erst parallelisieren, nachdem der jeweilige Dienst die ID rausgerückt hat).

    Das funktioniert natürlich nur für statische IDs, was aber nicht immer der Fall sein muss. Sind die IDs dynamisch, dann dürfte es schnell haarig für den Doppelgänger werden, den Überblick zu behalten ;)

  3. Re: YQL

    Autor gkob 16.08.11 - 16:11

    > > Schon jemand getestet was die Vorteile/Unterschiede gegenüber YQL (Yahoo
    > > Query Language) sind?
    > > developer.yahoo.com
    >
    > Wenn ich es richtig verstehe, dann sind das zwei verschiedene Paar Schuhe.
    > YQL ist schon um einiges komplexer.

    Doppelganger macht Duplikaterkennung, oder auch Record Linkage genannt. Das heißt die Engine sucht ähnliche Objekte in den Datenbanken und bestimmt dann ob sie mich hoher Wahrscheinlichkeit gleich sind. Und manchmal muss nochmal ein Mensch draufschauen.

    >
    > Doppelganger scheint wohl einfach nur ein Verzeichnis von IDs/PrimaryKeys
    > für verschiedene WebServices zu sein. Nach dem Muster:
    > Anstatt bei zehn Diensten einzeln eine Suchanfrage nach der ID für Berlin
    > zu stellen und dann erst sich die Daten zu Berlin holen zu können, stellt
    > man eine einzelne Suchanfrage an Doppelganger mit dem Ort und bekommt dann
    > alle IDs, mit denen man bei den anderen Diensten die Daten holen kann. Das
    > spart 9 Requests und im Idealfall lässt sich das Daten-Abholen
    > parallelisieren, wodurch ein weiterer Vorteil entsteht (sonst liesse es
    > sich erst parallelisieren, nachdem der jeweilige Dienst die ID rausgerückt
    > hat).

    Genau. Wir (ich arbeite bei Uberblic) helfen vorallem in solchen Fällen wenn das Suchen in verschiedenen Diensten nicht so einfach ist. "Berlin" findet man noch, aber meist hat man es mit unbereinigten Datenbanken zu tun. Schreibweise der Namen, Addressen, etc, alles fuzzy.

    > Das funktioniert natürlich nur für statische IDs, was aber nicht immer der
    > Fall sein muss. Sind die IDs dynamisch, dann dürfte es schnell haarig für
    > den Doppelgänger werden, den Überblick zu behalten ;)

    Dynamische IDs sind meist recht ungeeignetete IDs in APIs :)



    1 mal bearbeitet, zuletzt am 16.08.11 16:12 durch gkob.

  4. Re: YQL

    Autor SharpCommenter 16.08.11 - 16:30

    Danke für die weitere Erklärung. Sicher eine spannende Sache, wenn es ins Detail geht.

    > [..] Wir (ich arbeite bei Uberblic) [..]

    Prima! Dann zieht bitte noch das Impressum auf Eurer Seite nach ;)

  5. Re: YQL

    Autor AndreK 16.08.11 - 16:46

    Soweit ich das sehe sind die Standort basierten Daten schon längst über eindeutige Werte verknüpft. Man nennt es Koordinaten ;-) Zumindest die APIs mit denen ich bisher so gearbeitet habe, können das.
    Der wirkliche Mehrwert ist ja anscheinend nur die Duplikaterkennung bzw. Bereinigung.
    Ich frag mich ob das alles sein soll was Doppelganger können soll oder was ist da noch so für die Zukunft geplant?
    Als erstes fielen mir da mal Sachen ein wie diverse Aktionen der unterschiedlichen API Plattformen mit eurere API zu vereinen. Sowas ist allerdings auch kein Hexenwerk.

  6. Re: YQL

    Autor gkob 16.08.11 - 17:12

    AndreK schrieb:
    --------------------------------------------------------------------------------
    > Soweit ich das sehe sind die Standort basierten Daten schon längst über
    > eindeutige Werte verknüpft. Man nennt es Koordinaten ;-) Zumindest die APIs
    > mit denen ich bisher so gearbeitet habe, können das.

    Koordinaten sind ungenau. Da gibt es in Innenstädten gerne mal 10-20 Meter Abweichung.

    Um z.B. ein Restaurant eindeutig in einer Datenbank zu bestimmen nimmt man nicht die Koordinate, sondern eine ID. Oder fragt APIs nach einer Kombination aus Koordinate und Name, und das ist dann eine Suche.

    Der Use Case den wir bedienen wäre aus einer API Restaurant Öffnungszeiten zu ziehen, aus einer anderen API die passenden Restaurantkritiken.

    > Der wirkliche Mehrwert ist ja anscheinend nur die Duplikaterkennung bzw.
    > Bereinigung.
    > Ich frag mich ob das alles sein soll was Doppelganger können soll oder was
    > ist da noch so für die Zukunft geplant?

    Klar ist für die Zukunft mehr geplant :) Die Duplikaterkennung / Zusammenführung von Datenbanken ist der Kern, wir lösen ein Problem das sehr viele Produktentwickler haben und eigentlich am liebsten nicht haben würden.

    > Als erstes fielen mir da mal Sachen ein wie diverse Aktionen der
    > unterschiedlichen API Plattformen mit eurere API zu vereinen. Sowas ist
    > allerdings auch kein Hexenwerk.

    Wenn es ein Hexenwerk wäre würde ich es auch nicht anfassen wollen :)
    Der Mehrwert für unsere Kunden ist 50% dass wir technisch Dinge können die sie selber nicht können, und 50% dass wir uns um Dinge kümmern um die sie sich nicht kümmern wollen.

Neues Thema Ansicht wechseln


Entschuldigung, nur registrierte Benutzer dürfen in diesem Forum schreiben. Klicken Sie hier um sich einzuloggen


Meistgelesen
  1. Libreoffice

    "Wir wollen Nutzer in die ODF-Welt ziehen"

  2. Browser

    Kauft Facebook Opera?

  3. Datenschutz

    Neue EU-Regeln zu Cookies treten in Kraft

  4. Blackberry

    RIM plant Massenentlassungen

  5. Samsung Galaxy S3

    Siri braucht sich nicht zu fürchten


Meistkommentiert
  1. Kommentare: 170 | letzter Beitrag 15:54 Uhr

  2. Kommentare: 94 | letzter Beitrag 26.05. 19:45

  3. Kommentare: 74 | letzter Beitrag 18:52 Uhr

  4. Kommentare: 70 | letzter Beitrag 18:56 Uhr

  5. Kommentare: 58 | letzter Beitrag 18:36 Uhr

Mehr



Haben wir etwas übersehen?

E-Mail an news@golem.de


Lollipop Chainsaw angespielt: Blond und brutal
Lollipop Chainsaw angespielt
Blond und brutal

Der japanische Spieldesigner Goichi Suda - Fans sagen schlicht "Suda 51" - ist für schräge Actionspiele bekannt. Sein nächstes Werk schickt ein scheinbar braves Schulmädchen in den Kampf gegen Zombies.

  1. Spielepublisher in Not dtp Entertainment meldet Insolvenz an
  2. US-Umsätze im März 2012 Spielemarkt schrumpft weiter
  3. Starlight Inception Lucas-Arts-Veteran kämpft für das Weltraum-Action-Genre

Samsung XE300: Google Chromebox versehentlich ausgeliefert
Samsung XE300
Google Chromebox versehentlich ausgeliefert

Weitgehend unbemerkt hat der US-Händler Tigerdirect die ersten Chromebox-Systeme von Google ausgeliefert. Für 330 US-Dollar bekommt der Nutzer recht gute Hardware in Nettop-Form, die sehr viel leistungsfähiger ist als die des Chromebook mit ChromeOS.

  1. Googles Aura Chromium OS mit klassischem Desktop

Bernd Schlömer: Twittern und Mailen für die Piratenpartei im Dienst verboten
Bernd Schlömer
Twittern und Mailen für die Piratenpartei im Dienst verboten

Der neue Chef der Piratenpartei steht im Verteidigungsministerium unter Druck. Elektronische Kommunikation für seine Partei ist ihm in der Dienstzeit untersagt. "Es gibt Leute im Ministerium, die darauf warten, dass ich Fehler mache", sagte Schlömer.

  1. Hartmut Semken Berliner Piratenparteichef tritt zurück
  2. Schulschwänzen Piratenpartei gegen elektronisches Klassenbuch
  3. Piratenpartei NRW "Wir bringen einen Schuss Chili ins Parlament"

  1. Renesas: Chiphersteller will ein Drittel der Beschäftigten loswerden
    Renesas
    Chiphersteller will ein Drittel der Beschäftigten loswerden

    Renesas ist nach Elpida der zweite schwer angeschlagene japanische Chiphersteller. Renesas, das Hitachi, Mitsubishi Electric und NEC gehört, macht Verlust und will seine größte Fabrik verkaufen.

  2. Blackberry: RIM plant Massenentlassungen
    Blackberry
    RIM plant Massenentlassungen

    RIM soll in den kommenden Tagen erneut einen massiven Stellenabbau ankündigen. "Ich habe herausgefunden, welche Teile ich in meinem Puzzle nicht mehr benötige", sagte Firmenchef Thorsten Heins.

  3. Browser: Kauft Facebook Opera?
    Browser
    Kauft Facebook Opera?

    Ein britisches Blog will erfahren haben, dass Facebook den norwegischen Browserhersteller Opera Software kaufen will. Beide Unternehmen wollen sich dazu nicht äußern.


  1. 15:41

  2. 13:23

  3. 14:48

  4. 14:29

  5. 14:24

  6. 12:30

  7. 12:23

  8. 18:49