Wie ich das verstehe geht es um die ids in der Datenbank die nun zu groß werden?
Warum setzte man nicht auf UUIDs?
http://en.wikipedia.org/wiki/Universally_unique_identifier#Random_UUID_probability_of_duplicates
Ash nazg durbatulûk, ash nazg gimbatul, ash nazg thrakatulûk agh burzum-ishi krimpatul.
Benutzer wird von Ihnen ignoriert. Anzeigen
burzum schrieb:
--------------------------------------------------------------------------------
> Wie ich das verstehe geht es um die ids in der Datenbank die nun zu groß
> werden?
>
> Warum setzte man nicht auf UUIDs?
>
> en.wikipedia.org#Random_UUID_probability_of_duplicates
Ich würde vermuten aus dem gleichen Grund, warum die meisten in DBs keine UUIDs verwenden - jedenfalls nicht als Primärschlüssel: da sie unnötig groß sind und als String daher kommen. Und Stringvergleiche sind von Natur aus uneffizienter als numerische.
Benutzer wird von Ihnen ignoriert. Anzeigen
cljk schrieb:
--------------------------------------------------------------------------------
> Und Stringvergleiche sind von Natur aus uneffizienter als numerische.
Exakt das ist der Grund. Der Rechenaufwand beim vergleichen zweier Buchstaben ist um ein vielfaches größer als beim vergleich zweier Zahlen. Deswegen arbeiten Datenbanken auch mit nummerischen IDs.
Benutzer wird von Ihnen ignoriert. Anzeigen
burzum schrieb:
--------------------------------------------------------------------------------
> Wie ich das verstehe geht es um die ids in der Datenbank die nun zu groß
> werden?
>
> Warum setzte man nicht auf UUIDs?
>
> en.wikipedia.org#Random_UUID_probability_of_duplicates
Wie die oben schon sagten, es ist langsam, bei millionen von Datensätzten merkst du das extrem.
<not serious> kannst dich zu unseren Externen Vollidioten gesellen </not serious>Die haben in der Datenbank hinter deren Anwendungen die PKs als NChar(25) und Numeric(8,0) deklariert...(ihr wollt gar nich wissen wie das Datenbankmodell aussieht) Jetzt darf ich das via ETL Prozessen 'reparieren' und in unser DWH zum Auswerten laden.
Was ich damit sagen möchte, wenn UUIDs jetzt 'in' werden, habe ich keine Lust immer wieder so eine Sche*ße zu Gold(=Auswertungsgeschwindigkeit) zu machen.
2 mal bearbeitet, zuletzt am 14.02.13 16:48 durch KeysUnlockTheWorld.
Benutzer wird von Ihnen ignoriert. Anzeigen
UUIDs lassen sich auch in Hex oder sogar Dezimalzahlen konvertieren.
Außerdem bietet MySql ein besonderen Feldtypen für UUIDs.
Und ich warte lieber 2 Sekunden länger für eine Abfrage als das ich in 4 Jahren einen Integer Overflow habe.
Jeder muss seine Prioritäten selber setzen.
PS: Ich kenne eine Datenbank die mehrere milliarden Einträge hat, in die hunderte Terabyte geht und UUIDs nutzt und trotzdem binnen < 2 Sekunden antwortet.
Benutzer wird von Ihnen ignoriert. Anzeigen
hungkubwa schrieb:
--------------------------------------------------------------------------------
> PS: Ich kenne eine Datenbank die mehrere milliarden Einträge hat, in die
> hunderte Terabyte geht und UUIDs nutzt und trotzdem binnen < 2 Sekunden
> antwortet.
Aha? Die da wäre?
In-memory wird es nicht sein, denn von "hunderte[n] Terabyte" Arbeitsspeicher hab ich noch nichts gehört.
Die Sache ist, dass es bei solch riesigen Datenmengen nicht bei einer Verzögerung von 2 Sekunden bleibt, sondern sich schnell auf 30 Sekunden oder größer ausdehnt.
Des Weiteren spielt die Last der Server eine immense Rolle. Sind genug Kapazitäten vorhanden, dass hunderte von Zugriffen "gleichzeitig" möglich sind?
Und zuletzt ist es ja nicht so, dass nur 1 Node zurückgegeben wird, sondern für eine Karte "viele tausende".
[Edit]Ach und nicht zu vergessen: OpenStreetMap & "begrenzte Mittel" sind Begriffe, die ganz eng miteinander verbunden sind.[/Edit]
Ich würd dich gerne mal sehen, wie du in die Karte reinzoomst oder die Karte verschiebst und dabei jedesmal 2 Sekunden warten musst, bis sich das Bild ruckelnd aufbaut...
2 mal bearbeitet, zuletzt am 15.02.13 10:22 durch lspcity.
Benutzer wird von Ihnen ignoriert. Anzeigen
KeysUnlockTheWorld schrieb:
--------------------------------------------------------------------------------
> burzum schrieb:
> ---------------------------------------------------------------------------
> -----
> > Wie ich das verstehe geht es um die ids in der Datenbank die nun zu groß
> > werden?
> >
> > Warum setzte man nicht auf UUIDs?
> >
> > en.wikipedia.org#Random_UUID_probability_of_duplicates
> Wie die oben schon sagten, es ist langsam, bei millionen von Datensätzten
> merkst du das extrem.
> kannst dich zu unseren Externen Vollidioten gesellen Die haben in der
> Datenbank hinter deren Anwendungen die PKs als NChar(25) und Numeric(8,0)
> deklariert...(ihr wollt gar nich wissen wie das Datenbankmodell aussieht)
> Jetzt darf ich das via ETL Prozessen 'reparieren' und in unser DWH zum
> Auswerten laden.
> Was ich damit sagen möchte, wenn UUIDs jetzt 'in' werden, habe ich keine
> Lust immer wieder so eine Sche*ße zu Gold(=Auswertungsgeschwindigkeit) zu
> machen.
Wie ueberall in der Welt hat alles seine Vor- und Nachteile.
UUIDs werden gerne in verteilten Anwendungen verwendet, oder halt da wo zentrale ID-Generierung schwierig/teuer ist.
Wenn du eine ETL-Phase hast, hast du in der auch alle Zeit der Welt, um aus den UUIDs alles moegliche zu machen. Wenn das immernoch zu lange dauert, hast du ein unschlagbares Argument fuer neue Hardware.
Benutzer wird von Ihnen ignoriert. Anzeigen
Kommentare: 356 | letzter Beitrag 18:05 Uhr
Kommentare: 244 | letzter Beitrag 16:40 Uhr
Kommentare: 188 | letzter Beitrag 18:08 Uhr
Kommentare: 157 | letzter Beitrag 14:39 Uhr
Kommentare: 156 | letzter Beitrag 15:51 Uhr
E-Mail an news@golem.de

Tagsüber sammelt der Spieler Vorräte und Waffen, nachts kämpft er gegen Zombies: Das ist das Grundkonzept von Dying Light, das Techland unter anderem für Playstation 4 und Xbox One produziert.

In nur vier Tagen hat eine Petition für Netzneutralität und gegen DSL-Drosselung die nötige Zahl der Mitzeichner gefunden. Jetzt will der Petent 100.000 erreichen.

Linuxtag 2013 Im Vergleich zu anderen europäischen Ländern tun sich die deutschen Behörden in Deutschland mit Open-Source-Software noch schwer. Eine Podiumsdiskussion auf dem Open-IT Summit 2013 offenbart das Problem: geschlossene Dokumentenstandards.

Einige Hard- und Softwarehersteller betreiben enormen Aufwand, um Funktionen auf ihren Geräten einzuschränken. MIT-Forscher Benjamin Mako Hill bezeichnet diese als "Antifeatures" - und sieht freie Software als Möglichkeit, sie einzudämmen.

Nach dem Kauf von Tumblr bietet Yahoo jetzt auch für die Video-on-Demand-Plattform Hulu. Das Unternehmen ist rund 2 Milliarden US-Dollar wert.

Zwei Drittel der Weltbevölkerung sind noch offline. Google X setzt mit einem großen Projekt auf mobiles Internet über TV-Frequenzen, Satelliten und Ballons.