1. Foren
  2. Kommentare
  3. Security
  4. Alle Kommentare zum Artikel
  5. › Hashfunktionen: Datenbank über New…

Salt + Mehrfach Hashing

  1. Thema

Neues Thema Ansicht wechseln


  1. Salt + Mehrfach Hashing

    Autor: /mecki78 26.06.14 - 04:50

    Salt alleine hilft nicht, sagt ja auch der Artikel. Stattdessen nimmt man einen Salt und wendet dann die Hashfunktion mehrfach an (n-Iterations), so ein paar zig tausend mal wäre gut. Da dauert dann zwar einige Zeit zu berechnen (sagen wir mal 20 Sekunden), aber das ist nicht weiter schlimm, wenn man mal einen Datensatz berechnet. Wenn man das hingegen 2 oder 22 Millionen mal machen muss, dann dauert das (bei 20 Sek pro Berechnung) bis zu 46 bzw. 509 Tage und das pro Datensatz (wegen des Salts muss man für jeden Datensatz wieder alle Möglichkeiten probieren). Auch das macht es nicht unmöglich die Daten zu bekommen, aber es würde Jahre dauern und wäre sollte warum so viel Zeit in diese Berechnung stecken? Alleine die Stromkosten dafür dürften einiges kosten und das ganze für welchen Gegenwert?

    /Mecki

  2. Re: Salt + Mehrfach Hashing

    Autor: robinx999 26.06.14 - 09:23

    Wenn man immer den Selben Salt verwendet würde es nicht viel ändern (und man kann kaum was anderes machen, da man sonst statistische Auswertungen unbrauchbar macht, man könnte nicht mehr ermitteln wieviele fahrten ein Taxi im Durchschnitt pro Tag / Woche macht) und mehrfasch hashen würde den angrif auch nur verlängern.

  3. Re: Salt + Mehrfach Hashing

    Autor: zoggole 26.06.14 - 12:12

    Ich denke ein salt wäre dann nur pro Nummernschild gleich, sodass ein einheitlicher Wert rauskommt. Für die meisten Einträge müsste man so dennoch eine eigene rainbowtable erstellen.

  4. Re: Salt + Mehrfach Hashing

    Autor: robinx999 26.06.14 - 12:22

    zoggole schrieb:
    --------------------------------------------------------------------------------
    > Ich denke ein salt wäre dann nur pro Nummernschild gleich, sodass ein
    > einheitlicher Wert rauskommt. Für die meisten Einträge müsste man so
    > dennoch eine eigene rainbowtable erstellen.
    Wenn es immer Unterschiedliche Salt werte sind und diese auch eine gewisse länge haben, dann würde man vermutlich jeden einzelnen Eintrag Bruteforcen und so lange man mehrere Millionen Hashes pro Sekunde berechnen kann wäre man auch bei rekursiven Hashes wohl nach einigen Tagen fertig. Eine Anonymisierung mittels Hash Funktion bei einer derartig kleinen Menge von Ursprungswerten kann meiner Meinung nach überhaupt nicht Funktionieren. Wenn überhaupt könnte man jedem Taxi eine zusätzliche Anonyme Nummer zu weisen und dann nur diese Nummer rausgeben und nichts was direkt mit dem Nummernschild zu tun hat.

  5. Re: Salt + Mehrfach Hashing

    Autor: /mecki78 26.06.14 - 13:52

    robinx999 schrieb:
    --------------------------------------------------------------------------------
    > Wenn man immer den Selben Salt verwendet würde es nicht viel ändern

    Nein, nein. Du verwendest einen anderen Salt pro Tabelleneintrag. Also:

    Zeile1: DatenA, DatenB, DatenC, ..., Salt, Hash1, Hash2, ...
    Zeile2: DatenA, DatenB, DatenC, ..., Salt, Hash1, Hash2, ...
    :

    D.h. du fängst bei jeder neuen Tabellenzeile wieder bei Null an, weil nichts was du zuvor berechnest hast, ist irgendwie von Nutzen. Der Salt muss nicht geheim sein, der kann einfach da stehen und er muss auch nicht besonders sein, eine 64 Bit pseudorandom Nummer erfüllt den Zweck.

    Idealerweise ist der Salt nie gleich eines vorherigen Salts (das könnte man bei der Berechnung prüfen, bevor man ihn verwendet), aber bei 2^64 Möglichkeiten ist die Wahrscheinlichkeit einer Kollision verschwindend gering und daher lohnt der Aufwand nicht.

    /Mecki

  6. Re: Salt + Mehrfach Hashing

    Autor: robinx999 26.06.14 - 15:06

    /mecki78 schrieb:
    --------------------------------------------------------------------------------
    > robinx999 schrieb:
    > ---------------------------------------------------------------------------
    > -----
    > > Wenn man immer den Selben Salt verwendet würde es nicht viel ändern
    >
    > Nein, nein. Du verwendest einen anderen Salt pro Tabelleneintrag. Also:
    >
    > Zeile1: DatenA, DatenB, DatenC, ..., Salt, Hash1, Hash2, ...
    > Zeile2: DatenA, DatenB, DatenC, ..., Salt, Hash1, Hash2, ...
    > :
    >
    Das mag bei Passwörtern Funktionieren, aber hier geht es um Anonymisierte Daten die soweit ich es Verstanden habe für Statistische Auswertungen nutzbar sein sollen. Und wenn jetzt jedes mal ein anderer Salt und somit auch ein anderer Hash für die Taxi ID benutzt wird hat man die Möglichkeiten der Statistischen auswertungen extrem minimiert.
    Wenn ich wissen will wieviele Fahren ein Taxi im Durchschnitt pro Tag / Woche (wie lange die Durchschnittliche Standzeit ist, etc) hat, brauche ich nunmal einheitliche IDs für die Taxis da kann sich der Hash nicht ständig ändern. Da dürfte es genug anfragen geben für die man die ID einheitlich braucht.

  7. Re: Salt + Mehrfach Hashing

    Autor: /mecki78 27.06.14 - 03:37

    robinx999 schrieb:
    --------------------------------------------------------------------------------
    > Das mag bei Passwörtern Funktionieren, aber hier geht es um Anonymisierte
    > Daten die soweit ich es Verstanden habe für Statistische Auswertungen
    > nutzbar sein sollen.

    Wo bitte steht das genau? Da steht, dass eine interne Datenbank (die intern gar nicht anonym ist) aufgrund einer Anfrage extern herausgegeben wurde und wegen Datenschutz vorher anonymisiert wurde.

    Für Statistiken hätte man auch ganz auf Hashing verzichten können und stattdessen jedem Taxi und jedem Fahrer einfach nur eine Nummer zuordnen können über eine "Mapping Tabelle", die auf gar keiner Berechnung basiert und sich somit gar nicht rückrechnen oder brute forcen lässt.

    /Mecki

  8. Re: Salt + Mehrfach Hashing

    Autor: robinx999 27.06.14 - 07:34

    /mecki78 schrieb:
    --------------------------------------------------------------------------------
    > robinx999 schrieb:
    > ---------------------------------------------------------------------------
    > -----
    > > Das mag bei Passwörtern Funktionieren, aber hier geht es um
    > Anonymisierte
    > > Daten die soweit ich es Verstanden habe für Statistische Auswertungen
    > > nutzbar sein sollen.
    >
    > Wo bitte steht das genau? Da steht, dass eine interne Datenbank (die intern
    > gar nicht anonym ist) aufgrund einer Anfrage extern herausgegeben wurde und
    > wegen Datenschutz vorher anonymisiert wurde.
    >
    Im Prinzip im Text
    "Der Blogger Chris Whong wollte Daten über Taxifahrten in New York auswerten "
    Und in der Quelle sieht man seinen antrag http://chriswhong.com/open-data/foil_nyc_taxi/
    Da steht als grund nur "Data Analysis" und man sieht dort auch eine Grafische Darstellung wieviele Taxis gleichzeitig in New York unterwegs sind (jeweils nach Wochentagen sortiert, das heißt er muss für seine Analysen die Taxis auseinander halten können da kann man nicht jedesmal einen anderen Salt nutzen)

    > Für Statistiken hätte man auch ganz auf Hashing verzichten können und
    > stattdessen jedem Taxi und jedem Fahrer einfach nur eine Nummer zuordnen
    > können über eine "Mapping Tabelle", die auf gar keiner Berechnung basiert
    > und sich somit gar nicht rückrechnen oder brute forcen lässt.

    Ja das wäre wohl die Sinvolle lösung gewesen denn einfach auf eine ID verzichten hätte die Auswertungne ja für viele arten von Anfragen unbrauchbar gemacht, aber jedem Taxi / Fahrer eine ID zuweisen die unabhängig von Nummernschildern und co ist wäre wohl sinvoll gewesen

  1. Thema

Neues Thema Ansicht wechseln


Um zu kommentieren, loggen Sie sich bitte ein oder registrieren Sie sich. Sie müssen ausserdem in Ihrem Account-Profil unter Forum einen Nutzernamen vergeben haben. Zum Login

Stellenmarkt
  1. GETEC net GmbH, Hannover
  2. Web Computing GmbH, Münster
  3. WITRON Gruppe, Parkstein (Raum Weiden / Oberpfalz)
  4. Rentschler Biopharma SE, Laupheim

Golem pur
  • Golem.de ohne Werbung nutzen

Anzeige
Top-Angebote
  1. 44€ (inkl. 15€ Direktabzug - Bestpreis!)
  2. 54,31€ (Bestpreis mit Amazon. Vergleichspreis 87,46€)
  3. 54,31€ (Bestpreis mit MediaMarkt. Vergleichspreis 87,46€)
  4. (u. a. Seagate BarraCuda Compute 8 TB für 158,90€ + 6,79€ Versand und Edifier Studio 1280T...


Haben wir etwas übersehen?

E-Mail an news@golem.de


  1. Ciclone E4: Garelli bringt kleines Elektro-Moped mit Wechselakku
    Ciclone E4
    Garelli bringt kleines Elektro-Moped mit Wechselakku

    Das Garelli Ciclone E4 mit entnehmbarem Akku ist je nach Version bis zu 45 km/h oder bis zu 70 km/h schnell unterwegs. Es soll in der Stadt als Autoersatz oder fürs Wohnmobil als Begleiter dienen.

  2. Smartphone: Google stellt das Pixel 4 ein
    Smartphone
    Google stellt das Pixel 4 ein

    Nach nicht mal einem Jahr beendet Google die Produktion des Pixel 4 und Pixel 4 XL. Noch im Herbst soll aber der Nachfolger erscheinen.

  3. Corona: Gewerkschaft sieht Schulen schlecht digital ausgestattet
    Corona
    Gewerkschaft sieht Schulen schlecht digital ausgestattet

    In vielen Bundesländern beginnt die Schule wieder, die zuständige Gewerkschaft erwartet ein Jahr mit "viel Improvisation". Grund sei die schlechte digitale Ausstattung.


  1. 14:58

  2. 14:11

  3. 13:37

  4. 12:56

  5. 12:01

  6. 14:06

  7. 13:41

  8. 12:48