1. Foren
  2. » Kommentare
  3. » OpenSource
  4. » Alle Kommentare zum Artikel
  5. » HadoopDB - Hybrid aus Hadoop und…

MapReduce

Anzeige
  1. Thema

Neues Thema Ansicht wechseln


  1. MapReduce

    Autor Jörg Zweier 28.07.09 - 16:12

    Von MapReduce liest man in letzter Zeit häufiger. Ich dachte immer, das wären Techniken, für Arrays, dass auf jedes Element eine bestimmte Funktion angewandt werden kann. Aber tatsächlich soll das irgendetwas von Google sein. Was ist der Unterschied? Wäre nett, wenn jemand dieses Missverständnis mal aufklären könnte.

  2. Re: MapReduce

    Autor ronninaldo 28.07.09 - 16:28

    auf wikipedia gibts einen artikel dazu

  3. Re: MapReduce

    Autor Jörg Zweier 28.07.09 - 16:43

    Ich hätte hier nicht gefragt, wenn ich nicht schon dort geschaut hätte. Leider bin ich kein Mathematiker und tue mich sehr schwer, die besagten Gleichungen nachvollziehen zu können. Gerade diese tragen zum Verständnis bei. Wäre nett, wenn du mir das erklären könntest.

  4. Re: MapReduce

    Autor Siga9876 28.07.09 - 18:28

    Da gehts doch nur um Konzepte. Die "Formeln" (sind eher Code-Teile/Definitionen/...) kann man auch ignorieren.
    Die Aufgabe an Sklaven verteilen und die Ergebnisse zusammenführen. Macht jede Firma. Aber nicht so effizient wie Google.

    Interessant dazu ist evtl noch ein Nebensatz aus der ct (über irgendwas, vermutlich parallel-programmieren): wenn komplette Daten des Problemes in den Cache passen (oder man das Problem entsprechend designt, sich den Mund also nicht zu voll stopft), dann kann der Speed-UP durch mehrere Prozessoren überl-linear sein. D.h. man wird mehr als doppelt so schnell (was spacken wohl erstmal pauschal bestreiten würden aber zwei 25kmH(+Tuning ;-)-Pizza-Mopeds liefern 10 Pizzen in der Stadt trotzdem schneller als ein 450kmH-Pizza-Porsche).
    Dadurch könnten auf verteilten Normalo-PCs deutliche Steigerungen gegenüber einem fetten SuperRechner für dasselbe Problem (SuchAnfragen, Werbung verteilen) erreicht werden.

  5. Re: MapReduce

    Autor Jörg Zweier 28.07.09 - 21:51

    Öh, sorry, aber ich kann mit deinem Post rein gar nichts anfangen.

    Wenn ich "Die Aufgabe an Sklaven verteilen und die Ergebnisse zusammenführen. Macht jede Firma." richtig verstanden habe, geht es einfach nur um Clustering? Dass man einen Masterserver hat und ganz viele Nodes, die von dem Masterserver Aufgaben entgegennehmen.

    Beim zweiten Teil handelt es sich vermutlich darum, dass Daten vorrätig im RAM gelagert werden, aber nicht zu viele, weil sonst die Abläufe verstopfen??? Ich bin sehr verwirrt.

    Ich hoffe, dass ich nicht der einzige bin, der gerade ein Brett vorm Kopf hat und absolut gar nichts nachvollziehen kann. :D

  6. Re: MapReduce

    Autor Siga9876 28.07.09 - 23:45

    Na ja. Vermutlich ist der Trick/das Besondere darin, das man ein FrameWork/Library hat, das einen bei der Verteilung der Arbeit unterstützt und man es vermutlich halbwegs standartisiert macht. Das erleichtert dann das Leben deutlich. Auch kann man dann alle Rechner von Google nutzen und nicht nur die Rechner auf dem eigenen Stockwerk(oder wo auch immer), wo man seine private Lösung für verteilung zusammengeschustert hat.
    Die heutige Golem-Meldung über diese Cloud-Control-Software wäre sonst ja auch egal/überflüssig.

    Wenn man Probleme lösen will, ist man hungrig auf Lösungen und frisst auch Hinweise statt Komplettlösungen (dafür gibts teure Leute von IBM/SAP/...). Ich schreibe hier keine abgebbaren Referate/Hausarbeiten.

  7. Re: MapReduce

    Autor Amerikaner 28.07.09 - 23:46

    Map-Reduce hilft bei der Verteilung des Aufwands. Ein Cluster mit einen "Master" und 10 "Sklaven" (nach Siga9876 System) soll die Maximum einer Vector mit zehn Milion Elementen berechnen. Jeder Knot bekommt einen Milion elemente, danach wird den 'Master" eine Ergebniss liefern, bassiert auf die 10 Ergebnisse der "Sklaven". Solche einfacher Berechnung entspricht aber viel Programierungsaufwand (netwerkuebertragung, synchronizationen, usw). MapReduce abstractiert die Uebertragungs- und Synchronizationsebene durch eine einfaches Konzept: Map Aktionen laufen parallel auf alle Zelle einer Vector (beispiel: vector durch skalar multiplizieren) warend Reduce Aktionen berechnet etwas wie eine Summe, max/min oder Norm.
    Es gibt verschiedene MapReduce implementierungen zum Beispiel fuer Cluster oder fuer Grafikkarte (NVidia-CUDA).

  8. Re: MapReduce

    Autor Jörg Zweier 29.07.09 - 01:20

    Danke fuer die Erklaerung.

    PS: Bist du wirklich Amerikaner?

  9. Re: MapReduce

    Autor Amerikaner 29.07.09 - 15:03

    PS:

    Ja.

    :)

  10. Re: MapReduce

    Autor Jörg Zweier 29.07.09 - 17:07

    Hehe, merkt man. :)

Neues Thema Ansicht wechseln


Entschuldigung, nur registrierte Benutzer dürfen in diesem Forum schreiben. Klicken Sie hier um sich einzuloggen


Meistgelesen
  1. Browser

    Kauft Facebook Opera?

  2. Libreoffice

    "Wir wollen Nutzer in die ODF-Welt ziehen"

  3. Datenschutz

    Neue EU-Regeln zu Cookies treten in Kraft

  4. Samsung Galaxy S3

    Siri braucht sich nicht zu fürchten

  5. Schmerzlos

    MIT-Forscher entwickeln Injektor mit Lorentzkraft-Antrieb


Meistkommentiert
  1. Kommentare: 222 | letzter Beitrag 26.05. 23:51

  2. Kommentare: 216 | letzter Beitrag 00:27 Uhr

  3. Kommentare: 160 | letzter Beitrag 26.05. 23:16

  4. Kommentare: 93 | letzter Beitrag 26.05. 19:45

  5. Kommentare: 68 | letzter Beitrag 25.05. 12:17

Mehr



Haben wir etwas übersehen?

E-Mail an news@golem.de


Zulieferer: Sony soll iPhone 5 mit In-Cell-Touchscreen ausrüsten
Zulieferer
Sony soll iPhone 5 mit In-Cell-Touchscreen ausrüsten

Laut Apple-Zulieferern wird das iPhone 5 mit einem neuartigen In-Cell-Touchscreen ausgerüstet. Als Hersteller soll Sony infrage kommen. Bislang hieß es, dass Apple Sharp und Toshiba bevorzugen würde.

  1. iPhone 5 Kleinerer Dock-Connector im Gespräch
  2. Streit um Domains Apple hat Domain iPhone5.com erhalten
  3. 4 Zoll iPhone 5 wohl mit größerem Display

Lollipop Chainsaw angespielt: Blond und brutal
Lollipop Chainsaw angespielt
Blond und brutal

Der japanische Spieldesigner Goichi Suda - Fans sagen schlicht "Suda 51" - ist für schräge Actionspiele bekannt. Sein nächstes Werk schickt ein scheinbar braves Schulmädchen in den Kampf gegen Zombies.

  1. Spielepublisher in Not dtp Entertainment meldet Insolvenz an
  2. US-Umsätze im März 2012 Spielemarkt schrumpft weiter
  3. Starlight Inception Lucas-Arts-Veteran kämpft für das Weltraum-Action-Genre

Samsung XE300: Google Chromebox versehentlich ausgeliefert
Samsung XE300
Google Chromebox versehentlich ausgeliefert

Weitgehend unbemerkt hat der US-Händler Tigerdirect die ersten Chromebox-Systeme von Google ausgeliefert. Für 330 US-Dollar bekommt der Nutzer recht gute Hardware in Nettop-Form, die sehr viel leistungsfähiger ist als die des Chromebook mit ChromeOS.

  1. Googles Aura Chromium OS mit klassischem Desktop

  1. Browser: Kauft Facebook Opera?
    Browser
    Kauft Facebook Opera?

    Ein britisches Blog will erfahren haben, dass Facebook den norwegischen Browserhersteller Opera Software kaufen will. Beide Unternehmen wollen sich dazu nicht äußern.

  2. Datenschutz: Neue EU-Regeln zu Cookies treten in Kraft
    Datenschutz
    Neue EU-Regeln zu Cookies treten in Kraft

    Am 26. Mai 2012 treten neue Datenschutzregeln der EU in Kraft. Websitebetreiber und Werbenetzwerke müssen Nutzer um Erlaubnis fragen, wenn sie Cookies setzen.

  3. Libreoffice: "Wir wollen Nutzer in die ODF-Welt ziehen"
    Libreoffice
    "Wir wollen Nutzer in die ODF-Welt ziehen"

    Libreoffice könne mehr als Openoffice und biete Entwicklern zudem Vorteile, sagte Michael Meeks auf dem Linuxtag 2012. Außerdem spricht er mit Golem.de über Libreoffice-Online, woran er derzeit arbeitet.


  1. 14:48

  2. 14:29

  3. 14:24

  4. 12:30

  5. 12:23

  6. 18:49

  7. 18:33

  8. 18:08