Abo
  1. Foren
  2. Kommentare
  3. OpenSource
  4. Alle Kommentare zum Artikel
  5. › Wikidata: Eine Datenquelle für alle…

Abbildung

  1. Thema

Neues Thema Ansicht wechseln


  1. Abbildung

    Autor: pwn2own 31.03.12 - 16:23

    Werden die Daten/Zusammenhänge in irgendeiner Universal-, bzw Einheitssprache abgebildet? Es gibt zwischen den einzelnen Sprachen ja ziemlich viele Konflikte. Wie werden die umgangen?

  2. Re: Abbildung

    Autor: MistelMistel 31.03.12 - 19:38

    Nicht zu vergessen das es wegen rückständigen Ländern wie den USA extra in SI Einheiten hinterlegt werden müsste und länderspezifisch umgerechnet...

  3. Re: Abbildung

    Autor: LH 31.03.12 - 21:41

    MistelMistel schrieb:
    --------------------------------------------------------------------------------
    > Nicht zu vergessen das es wegen rückständigen Ländern wie den USA extra in
    > SI Einheiten hinterlegt werden müsste und länderspezifisch umgerechnet...

    Was ist den bitte an den SI Einheiten schlecht, das du der Meinung bist das es ein "extra" erfordert?
    Damit dürfte man in weiten teilen der Welt einfach die Realität darstellen.
    Für die USA muss man dann umrechnen, aber das ist für die ein Problem, nicht für "uns".

  4. Re: Abbildung

    Autor: samy 01.04.12 - 00:02

    LH schrieb:
    --------------------------------------------------------------------------------
    > MistelMistel schrieb:
    > ---------------------------------------------------------------------------
    > -----
    > > Nicht zu vergessen das es wegen rückständigen Ländern wie den USA extra
    > in
    > > SI Einheiten hinterlegt werden müsste und länderspezifisch
    > umgerechnet...
    >
    > Was ist den bitte an den SI Einheiten schlecht, das du der Meinung bist das
    > es ein "extra" erfordert?
    > Damit dürfte man in weiten teilen der Welt einfach die Realität darstellen.
    >
    > Für die USA muss man dann umrechnen, aber das ist für die ein Problem,
    > nicht für "uns".

    Verstehe ich auch nicht. Hab mich gerade mal schlau gemacht. SI, sind ja die Internatinalen Maßeinheiten, und warum sollte man die nicht verwenden? Die Werte die ich kenne stimmen auch alle mit den deutschen Werten überein. Nur bei Temperatur hat SI halt Kalvin statt Celcius.

    -------------------------------------------------
    Für offene Standards
    -------------------------------------------------

  5. Re: Abbildung

    Autor: lruks 01.04.12 - 19:45

    Lest euch doch einfach den Technical Propasal durch: http://meta.wikimedia.org/wiki/Wikidata/Technical_proposal .
    Wikipedia = Menge von verlinkten Artikeln / Dokumenten
    WikiData = Menge von semantisch verlinkten Entitäten .

    Artikel sind nicht leicht maschinenlesbar bzw. -verwertbar, da in solchen unstrukturierten Dokumenten Informationen darüber fehlen, welche Bedeutung hinter den Wörtern steckt. In unseren Köpfen ist eine solche Bedeutung/Semantik manifestiert. Wir wissen z.B. das hinter dem Wort Baum eine Pflanze steht, die gewisse Eigenschaften hat und mit anderen Dingen der Umwelt in Beziehung steht.

    Wenn ein Dokument von Maschinen verwertet werden soll, dann muss die Maschine erstmal herausfinden, über was eigentlich geschrieben wird. Also welche Ding bzw. Entitäten in dem Text vorkommen und wie sie in diesem Text in Beziehung gebracht werden. Bspw.: "Holz ist der Hauptrohstoff zur Papierproduktion". Für uns ist klar: Hier geht es um Holz (1. Entität) und Papier (2. Entität) und Papier wird aus Holz hergestellt. Für Maschinen ist das nicht so einfach:
    1. Was sind denn jetzt eigentlich die Entitäten ? Holz, Hauptrohstoff, Papierproduktion ? Wie soll die Maschine herausfinden, dass Papierproduktion ein zusammengesetztes Substantiv ist ? Als Anfangspunkt bzw. Indiz werden hier meist die Substantive eines Satzes genutzt. Das kann aber auch nach hinten los gehen.
    2. Welche Beziehungen haben die Entitäten ? Ist ? Also: Holz ist Papier ? Stimmt bedingt. Allerdings sagt der Satz viel mehr aus: Papier ist Produkt von Holz. D.h. aus dem Wort Papierproduktion wird nicht nur eine Entität sondern auch eine Beziehung abgeleitet.

    Nehmen wir mal an, wir haben tolle Methoden die das alles können (es gibt da wirklich ein paar ganz Interessante). Dann bleiben immer noch Probleme wie die Doppeldeutigkeit eines Wortes, Mehrere Wörter die die gleichen Entitäten referenzieren usw. übrig.

    Das Tolle an Wikipedia ist nun, dass hier jeder Artikel genau eine Entität repräsentiert. Bspw. handelt der Artikel Klaus Wowereit über den Politiker Klaus Wowereit. D.h. die Entität die dahinter steckt ist eine Person. Eine Beziehung dieser Entität wäre dann z.B. hatNamen. Strukturiert dargestellt und für Maschinen bedeutend besser verwertbar bzw. lesbar ist dann:

    klausW istVomTyp Person .
    klausW hatNamen "Klaus Wowereit" .
    klausW hatArtikel http://de.wikipedia.org/de/Klaus_Wowereit .
    klausW hatArtikel http://en.wikipedia.org/de/Klaus_Wowereit .

    Und genau dass will man mit WikiData erreichen. Maschinen können auf solchen Daten Inferenz betreiben, d.h. neue Fakten finden die durch die aktuelle Wissensbasis gedeckt sind, allerdings noch nicht explizit aufgeschrieben wurde.
    Was wirklich toll ist, dass hier erstmals nicht nur Menschen Daten eingeben und ändern können, sondern auch Maschinen direkt an dieser globalen Wissensbasis mitarbeiten können und nicht nur die Hohlköpfe sind, die Nutzer eingaben validieren.

    Dann braucht es auch keine Universalsprache, sondern kann z.B. einfach einen neuen Fakt an eine Entität anfügen. Bspw.: klausW hatAlter 66. Und das ist dann in jedem Wikipedia Artikel in der Infobox verfügbar. Als Datenformat wurde JSON und RDF vorgeschlagen.

    Mit SI usw. hat das gar nichts zu tun.

    Sowas Ähnliches gibt es übrigens schon: dbpedia.org.

    Hoffe ich konnte ein wenig helfen.

  6. Re: Abbildung

    Autor: Mr. Plastic 02.04.12 - 10:52

    lruks schrieb:
    --------------------------------------------------------------------------------
    > Lest euch doch einfach den Technical Propasal durch: meta.wikimedia.org .
    > Wikipedia = Menge von verlinkten Artikeln / Dokumenten
    > WikiData = Menge von semantisch verlinkten Entitäten .
    >
    > Sowas Ähnliches gibt es übrigens schon: dbpedia.org.

    Ich habe mich auch extrem gewundert, das hier und im Technical Proposal weder auf dbpedia.org noch auf semantic-mediawiki.org hingewiesen/verlinkt wird.

    90% von dem was im Proposal steht, wird seit Jahren schon mit in den beiden Projekten realisiert. Es fehlt imho bisher hauptsächlich die Bereitschaft diese Dinge zu integrieren und kluge Köpfe, die es für die Größe von Wikipedia effizient implementieren können.

  7. Re: Abbildung

    Autor: eiapopeia 03.04.12 - 13:11

    lruks schrieb:
    --------------------------------------------------------------------------------
    > [ausführliche Erklärung]
    >
    > Hoffe ich konnte ein wenig helfen.

    Konntest du. Danke!

  1. Thema

Neues Thema Ansicht wechseln


Um zu kommentieren, loggen Sie sich bitte ein oder registrieren Sie sich. Zum Login

Stellenmarkt
  1. Universität Passau, Passau
  2. Lebensversicherung von 1871 a. G. München, München
  3. Sanacorp Pharmahandel GmbH, Planegg bei München
  4. Stadtwerke München GmbH, München

Golem pur
  • Golem.de ohne Werbung nutzen

Anzeige
Spiele-Angebote
  1. (-78%) 4,39€
  2. 229,00€
  3. (-90%) 5,99€


Haben wir etwas übersehen?

E-Mail an news@golem.de


Recruiting: Wenn das eigene Wachstum zur Herausforderung wird
Recruiting
Wenn das eigene Wachstum zur Herausforderung wird

Gerade im IT-Bereich können Unternehmen sehr schnell wachsen. Dabei können der Fachkräftemangel und das schnelle Onboarding von neuen Mitarbeitern zum Problem werden. Wir haben uns bei kleinen Startups und Großkonzernen umgehört, wie sie in so einer Situation mit den Herausforderungen umgehen.
Von Robert Meyer

  1. Recruiting Alle Einstellungsprozesse sind fehlerhaft
  2. LoL Was ein E-Sport-Trainer können muss
  3. IT-Arbeit Was fürs Auge

How to von Randall Munroe: Alltagshilfen für die Nerd-Seele
How to von Randall Munroe
Alltagshilfen für die Nerd-Seele

"Ein Buch voll schlechter Ideen" verspricht XKCD-Autor Randall Munroe mit seinem neuen Werk How to. Es bietet einfache Anleitungen für alltägliche Aufgaben wie Freunde zu finden. Was kann bei dem absurden Humor des Autors schon schief gehen? Genau: Nichts!
Eine Rezension von Sebastian Grüner


    Garmin Fenix 6 im Test: Laufzeitmonster mit Sonne im Herzen
    Garmin Fenix 6 im Test
    Laufzeitmonster mit Sonne im Herzen

    Bis zu 24 Tage Akkulaufzeit, im Spezialmodus sogar bis zu 120 Tage: Garmin setzt bei seiner Sport- und Smartwatchserie Fenix 6 konsequent auf Akku-Ausdauer. Beim Ausprobieren haben uns neben einem System zur Stromgewinnung auch neue Energiesparoptionen interessiert.
    Ein Test von Peter Steinlechner

    1. Fenix 6 Garmins Premium-Wearable hat ein Pairing-Problem
    2. Wearable Garmin Fenix 6 bekommt Solarstrom

    1. Elektromobilität: Stromwirtschaft will keine Million öffentlicher Ladesäulen
      Elektromobilität
      Stromwirtschaft will keine Million öffentlicher Ladesäulen

      Verkehrsminister Scheuer will günstige Elektroautos stärker fördern, Vizekanzler Olaf Scholz fordert "so was wie ein Eine-Million-Ladesäulen-Programm". Doch die Stromversorger warnen vor einer "überdimensionierten Ladeinfrastruktur".

    2. Saudi-Arabien: Drohnenangriffe legen halbe Erdölproduktion lahm
      Saudi-Arabien
      Drohnenangriffe legen halbe Erdölproduktion lahm

      Drohnen aus dem Jemen sollen die wichtigste Erdölraffinerie Saudi-Arabiens in Brand gesetzt haben. Die USA beschuldigen den Iran, die Huthi-Rebellen mit der Waffentechnik ausgerüstet zu haben.

    3. Biografie erscheint: Union lehnt Asyl für Snowden weiter ab
      Biografie erscheint
      Union lehnt Asyl für Snowden weiter ab

      US-Whistleblower Edward Snowden hätte weiterhin nichts dagegen, Russland in Richtung Deutschland zu verlassen. Doch Schutz vor einer Auslieferung in die USA kann er hierzulande nicht erwarten.


    1. 14:21

    2. 12:41

    3. 11:39

    4. 15:47

    5. 15:11

    6. 14:49

    7. 13:52

    8. 13:25