Servus Leute,
eins vorab - eigentlich kenn ich mich in Linux und allem recht gut aus - auch in der Begriffs-Welt bin ich nicht weit hinterher, aber nun frage ich mich doch, was ein Cluster eigentlich ist?
Handelt es sich bei HADOOP um einem Cluster
- um mehr GiB Festplatten-Sepeicher zu bekommen,
- um CPU-Power zu kombinieren und so z.B. einen SuperComputer zu bauen,
- um Daten auf den Festplatten auf allen Nodes synchron zu halten,
- um ein intelligentes RAID-5 auf Netzwerkbasis
????
Was ist nun ein Cluster? :-)
Macht so ein Cluster nur auf "nicht-dynamischen"-Seiten / Download-Seiten Sinn?
Lässt sich ein Cluster sinnvoll für eine Datenbank-Applikation betreiben um somit mehrere Nutzer zur selben Zeit mit Daten zu versorgen? Und sind zu jedem Zeitpunkt die Daten auch wirklich synchron?
Liebe Grüße,
Michael.
Benutzer wird von Ihnen ignoriert. Anzeigen
http://de.wikipedia.org/wiki/Computercluster
Benutzer wird von Ihnen ignoriert. Anzeigen
elefant schrieb:
-------------------------------------------------------
> de.wikipedia.org
was ne Leistung, du kannst verlinken.
Die Frage ist aber durchaus berechtigt. Was macht das Ding? Ist es für Ausfallsicherheit oder Lastverteilung gedacht (um es mal auf 2 Kategorien einzudampfen).
verlinker
Benutzer wird von Ihnen ignoriert. Anzeigen
verlinker schrieb:
> Die Frage ist aber durchaus berechtigt. Was macht
> das Ding? Ist es für Ausfallsicherheit oder
> Lastverteilung gedacht (um es mal auf 2 Kategorien
> einzudampfen).
"Apache Hadoop is a free Java software framework that supports data intensive distributed applications running on large clusters of commodity computers.[1] It enables applications to work with thousands of nodes and petabytes of data. Hadoop was inspired by Google's MapReduce and Google File System (GFS) papers."
http://en.wikipedia.org/wiki/Hadoop
Es geht darum, Such- und Sortier-Algorithmen auf _riesige_ Datenmengen anzuwenden. Diese müssen natürlich irgendwo vorgehalten werden (deshalb ist ein distributed filesystem vorhanden), aber auch verteiltes Rechnen muss irgendwie gesteuert werden ("Job Tracker" und "Task Tracker").
last.fm benutzt zB auch Hadoop um ihre riesigen Datenbestände zu verwalten und auszuwerten (zB das Suchen von Musiknachbarn).
Benutzer wird von Ihnen ignoriert. Anzeigen
Hadoop hat ein eigens Java-Filesystem, das die Daten auf mind. 3 Systeme a 64MB-Dateien verteilt. Das gewährt Ausfallsicherheit ähnlich einem RAID.
Wenn ich es richtig verstanden habe, gibt es den Job Tracker, der weiß wo die Daten liegen und entscheidet, wo gewünschte Operationen (möglichst auf der selben Maschine) damit durchgeführt werden.
Yahoo! setzt es auf seinen Clustern ein.
Benutzer wird von Ihnen ignoriert. Anzeigen
Kommentare: 345 | letzter Beitrag 21:47 Uhr
Kommentare: 204 | letzter Beitrag 12:37 Uhr
Kommentare: 172 | letzter Beitrag 21:48 Uhr
Kommentare: 120 | letzter Beitrag 20:41 Uhr
Kommentare: 97 | letzter Beitrag 16:26 Uhr
E-Mail an news@golem.de

Laut einem SAP Vice President für die Cloud-Sparte sind USB-Sticks mit Schadsoftware und selbstgestrickte IT die Hauptgefahren für die Sicherheit der Unternehmens-IT.

Die Regierungsmehrheit hat im Umweltausschuss verhindert, dass das Verkleben von im Macbook Pro eingebauten Komponenten verboten wird. Diese Praxis erschwert laut einem Gutachten einen Austausch oder eine Reparatur.

Über eine Schwachstelle im Linux-Kernel kann sich ein lokaler Angreifer von einem eingeschränkten Konto Root-Rechte verschaffen. Die Schwachstelle besteht bereits seit mehreren Jahren. Die Lücke wurde klammheimlich geschlossen.

Erst erklärt Electronic Arts, keine Spiele mehr für die Wii U produzieren zu wollen, nun schimpft ein leitender Entwickler über die Konsole. Immerhin: Ein anderer Publisher stärkt Nintendo den Rücken.

Nahezu zeitgleich mit dem positiven Bericht einer von Apple beauftragten Organisation über die Arbeitsbedingungen bei Foxconn, berichtet die unabhängige Gruppe China Labor Watch über Suizide im Werk in Zhengzhou.

Zwei ehemalige Valve-Mitarbeiter haben auf einer Entwicklermesse eine revolutionäre AR-Brille gezeigt. Damit sollen sich computergenerierte Objekte räumlich korrekt in die Echtwelt einblenden lassen.