1. Foren
  2. » Kommentare
  3. » OpenSource
  4. » Alle Kommentare zum Artikel
  5. » Hadoop-Cluster als Live-CD

Blick nicht so ganz durch

Anzeige
  1. Thema

Neues Thema Ansicht wechseln


  1. Blick nicht so ganz durch

    Autor RcRaCk2k 05.09.08 - 10:45

    Servus Leute,

    eins vorab - eigentlich kenn ich mich in Linux und allem recht gut aus - auch in der Begriffs-Welt bin ich nicht weit hinterher, aber nun frage ich mich doch, was ein Cluster eigentlich ist?

    Handelt es sich bei HADOOP um einem Cluster

    - um mehr GiB Festplatten-Sepeicher zu bekommen,
    - um CPU-Power zu kombinieren und so z.B. einen SuperComputer zu bauen,
    - um Daten auf den Festplatten auf allen Nodes synchron zu halten,
    - um ein intelligentes RAID-5 auf Netzwerkbasis

    ????

    Was ist nun ein Cluster? :-)

    Macht so ein Cluster nur auf "nicht-dynamischen"-Seiten / Download-Seiten Sinn?

    Lässt sich ein Cluster sinnvoll für eine Datenbank-Applikation betreiben um somit mehrere Nutzer zur selben Zeit mit Daten zu versorgen? Und sind zu jedem Zeitpunkt die Daten auch wirklich synchron?

    Liebe Grüße,
    Michael.

    Benutzer wird von Ihnen ignoriert. Anzeigen

  2. Re: Blick nicht so ganz durch

    Autor elefant 05.09.08 - 10:48

    http://de.wikipedia.org/wiki/Computercluster

    Benutzer wird von Ihnen ignoriert. Anzeigen

  3. Re: Blick nicht so ganz durch

    Autor verlinker 05.09.08 - 11:05

    elefant schrieb:
    -------------------------------------------------------
    > de.wikipedia.org

    was ne Leistung, du kannst verlinken.

    Die Frage ist aber durchaus berechtigt. Was macht das Ding? Ist es für Ausfallsicherheit oder Lastverteilung gedacht (um es mal auf 2 Kategorien einzudampfen).

    verlinker

    Benutzer wird von Ihnen ignoriert. Anzeigen

  4. Re: Blick nicht so ganz durch

    Autor abbe 05.09.08 - 11:11

    verlinker schrieb:
    > Die Frage ist aber durchaus berechtigt. Was macht
    > das Ding? Ist es für Ausfallsicherheit oder
    > Lastverteilung gedacht (um es mal auf 2 Kategorien
    > einzudampfen).

    "Apache Hadoop is a free Java software framework that supports data intensive distributed applications running on large clusters of commodity computers.[1] It enables applications to work with thousands of nodes and petabytes of data. Hadoop was inspired by Google's MapReduce and Google File System (GFS) papers."

    http://en.wikipedia.org/wiki/Hadoop

    Es geht darum, Such- und Sortier-Algorithmen auf _riesige_ Datenmengen anzuwenden. Diese müssen natürlich irgendwo vorgehalten werden (deshalb ist ein distributed filesystem vorhanden), aber auch verteiltes Rechnen muss irgendwie gesteuert werden ("Job Tracker" und "Task Tracker").

    last.fm benutzt zB auch Hadoop um ihre riesigen Datenbestände zu verwalten und auszuwerten (zB das Suchen von Musiknachbarn).

    Benutzer wird von Ihnen ignoriert. Anzeigen

  5. Re: Blick nicht so ganz durch

    Autor elephantus 05.09.08 - 11:16

    Hadoop hat ein eigens Java-Filesystem, das die Daten auf mind. 3 Systeme a 64MB-Dateien verteilt. Das gewährt Ausfallsicherheit ähnlich einem RAID.

    Wenn ich es richtig verstanden habe, gibt es den Job Tracker, der weiß wo die Daten liegen und entscheidet, wo gewünschte Operationen (möglichst auf der selben Maschine) damit durchgeführt werden.

    Yahoo! setzt es auf seinen Clustern ein.

    Benutzer wird von Ihnen ignoriert. Anzeigen

Neues Thema Ansicht wechseln


Entschuldigung, nur registrierte Benutzer dürfen in diesem Forum schreiben. Klicken Sie hier um sich einzuloggen

SAP: "Nicht das Internet ist böse, sondern der USB-Stick"
SAP
"Nicht das Internet ist böse, sondern der USB-Stick"

Laut einem SAP Vice President für die Cloud-Sparte sind USB-Sticks mit Schadsoftware und selbstgestrickte IT die Hauptgefahren für die Sicherheit der Unternehmens-IT.

  1. Cloud Computing Opennebula 4.0 erlaubt VM-Snapshots
  2. Openstack IBM setzt bei Cloud-Computing auf Open Source
  3. Dell Ophelia Android-Cloud mit HDMI-Anschluss

Geplante Obsoleszenz: Regierung lehnt Mindestnutzungsdauer von Technikprodukten ab
Geplante Obsoleszenz
Regierung lehnt Mindestnutzungsdauer von Technikprodukten ab

Die Regierungsmehrheit hat im Umweltausschuss verhindert, dass das Verkleben von im Macbook Pro eingebauten Komponenten verboten wird. Diese Praxis erschwert laut einem Gutachten einen Austausch oder eine Reparatur.

  1. Geplante Obsoleszenz Gesetz soll Mindestnutzungsdauer für Elektronik erzwingen
  2. Zendock Dockingstation für Macbook Pro und Retina-Modelle
  3. Geplante Obsoleszenz Grünen-Gutachten kritisiert verklebtes Macbook Pro

Security: Gefährliche Lücke im Linux-Kernel
Security
Gefährliche Lücke im Linux-Kernel

Über eine Schwachstelle im Linux-Kernel kann sich ein lokaler Angreifer von einem eingeschränkten Konto Root-Rechte verschaffen. Die Schwachstelle besteht bereits seit mehreren Jahren. Die Lücke wurde klammheimlich geschlossen.

  1. Polizei Apple hat Warteliste für Umgehung der iPhone-Verschlüsselung
  2. Security D-Link patcht Sicherheitslücken in Routern und IP-Kameras
  3. Stonesoft Intel bietet 389 Millionen Euro für Firewall-Anbieter

  1. Electronic Arts: Leitender EA-Entwickler bezeichnet Wii U als "Mist"
    Electronic Arts
    Leitender EA-Entwickler bezeichnet Wii U als "Mist"

    Erst erklärt Electronic Arts, keine Spiele mehr für die Wii U produzieren zu wollen, nun schimpft ein leitender Entwickler über die Konsole. Immerhin: Ein anderer Publisher stärkt Nintendo den Rücken.

  2. Apple-Zulieferer: Wieder drei Suizide bei Foxconn
    Apple-Zulieferer
    Wieder drei Suizide bei Foxconn

    Nahezu zeitgleich mit dem positiven Bericht einer von Apple beauftragten Organisation über die Arbeitsbedingungen bei Foxconn, berichtet die unabhängige Gruppe China Labor Watch über Suizide im Werk in Zhengzhou.

  3. Cast AR: Gefeuerte Valve-Entwickler zeigen Räumliche-Objekte-Brille
    Cast AR
    Gefeuerte Valve-Entwickler zeigen Räumliche-Objekte-Brille

    Zwei ehemalige Valve-Mitarbeiter haben auf einer Entwicklermesse eine revolutionäre AR-Brille gezeigt. Damit sollen sich computergenerierte Objekte räumlich korrekt in die Echtwelt einblenden lassen.


  1. 14:15

  2. 13:48

  3. 12:33

  4. 14:00

  5. 12:39

  6. 10:41

  7. 10:05

  8. 10:02