Ich stand vor drei Jahren in einem klimatisierten Serverraum in Frankfurt, während mein Kunde bleich auf sein Tablet starrte. Er hatte ein Backup-System für seine Architekturkanzlei selbst konfiguriert und dabei eine einfache Annahme getroffen, die ihn am Ende fast 4.000 Euro an ungeplanten Nachzahlungen kostete. Er dachte, er wisse, Wie Viel MB Sind Ein Gigabyte ergeben, und kalkulierte starr mit dem Faktor 1.000. Als das System unter Last lief und die automatisierte Skalierung der Cloud-Instanzen griff, fraß der Unterschied zwischen der binären Realität der Hardware und seiner dezimalen Kalkulation sein Budget auf. In der Theorie klingen diese Abweichungen winzig, fast vernachlässigbar. In der Praxis, wenn Sie Terabytes an Daten verschieben oder Bandbreiten für Tausende Nutzer buchen, wird diese Unwissenheit zum finanziellen Brandbeschleuniger. Ich habe diesen Fehler bei Startups und gestandenen Mittelständlern gesehen: Man verlässt sich auf die Anzeige im Betriebssystem und wundert sich, warum die Rechnung des Providers eine völlig andere Sprache spricht.
Der fatale Irrtum zwischen 1.000 und 1.024
Der häufigste Fehler ist die Annahme, dass die Computerwelt so funktioniert wie das Wiegen von Mehl im Supermarkt. Im Dezimalsystem ist alles einfach: Ein Kilo sind 1.000 Gramm. Doch Ihr Computer denkt nicht in Zehnerpotenzen. Er denkt in Zweierpotenzen. Ein Gigabyte im klassischen Sinne der Informatik basiert auf $2^{10}$ Schritten. Das bedeutet, dass die Antwort auf die Frage, Wie Viel MB Sind Ein Gigabyte, eigentlich 1.024 lautet, wenn man von Megabyte spricht. Für eine weitere Sichtweise, schauen Sie sich an: diesen verwandten Artikel.
Warum ist das ein Problem? Weil Marketingabteilungen von Festplattenherstellern das Dezimalsystem lieben. Sie schreiben „1 TB“ auf die Verpackung und meinen damit 1.000.000.000.000 Bytes. Ihr Betriebssystem – egal ob Windows oder eine Linux-Distribution – rechnet aber meist binär. Sobald Sie diese Platte anschließen, fehlen Ihnen plötzlich rund 7 % der versprochenen Kapazität. Das ist kein Defekt. Das ist Mathematik. Wer seine Datenbanken so knapp plant, dass dieser Puffer nicht existiert, riskiert Systemabstürze, sobald die Partition voll läuft. Ich habe Administratoren gesehen, die mitten in der Nacht Migrationen durchführen mussten, weil sie beim Einkauf die „binäre Steuer“ ignoriert hatten.
Die Verwirrung durch Gibibyte und die wahre Antwort auf Wie Viel MB Sind Ein Gigabyte
Um dieses Chaos zu ordnen, wurden eigentlich Begriffe wie Mebibyte (MiB) und Gibibyte (GiB) eingeführt. Die International Electrotechnical Commission (IEC) wollte damit Klarheit schaffen: MB steht für 1.000 KB, MiB steht für 1.024 KiB. Klingt logisch, hat sich aber in der Praxis kaum durchgesetzt. Die meisten Leute sagen Gigabyte, meinen aber Gibibyte. Oder sie sagen Gigabyte und meinen tatsächlich die glatte 1.000er-Zahl. Zusätzliche Informationen in dieser Sache wurden von Netzwelt veröffentlicht.
Wenn Sie einen Cloud-Server bei AWS oder Azure mieten, rechnen diese oft in GiB (1.024er Basis). Wenn Sie aber den Datentransfer für Ihre Webseite berechnen, nutzen viele Netzwerkanbieter das Dezimalsystem. Hier liegt die Falle. Wer eine Strategie für sein Datenmanagement entwirft, muss zuerst klären, welche Einheit der Vertragspartner nutzt. Ein Vorher-Nachher-Vergleich macht das deutlich: Ein Projektleiter bei einem Medienhaus kalkulierte das Archiv für Videomaterial. Er rechnete mit 1.000 MB pro GB, weil es einfacher im Kopf zu überschlagen war. Bei 500 Terabyte Rohmaterial ergab sich eine Differenz von über 35 Terabyte zur tatsächlichen Speicherbelegung auf den Servern. Vorher dachte er, er hätte noch Wochen Zeit bis zur Erweiterung. Nachher wurde ihm klar, dass das System bereits am Limit lief und die Performance der Datenbanken durch die Fragmentierung bereits einbrach. Er musste innerhalb von 24 Stunden teuren Speicher nachkaufen, statt ihn langfristig und günstig zu leasen.
Warum die Hardware-Architektur keine Kompromisse macht
Computer adressieren Speicher über Adressleitungen. Jede Leitung verdoppelt die Anzahl der ansprechbaren Stellen. Deshalb sind RAM-Riegel 8, 16 oder 32 GB groß und nicht 10 oder 20. Diese physische Realität lässt sich nicht wegdiskutieren. Wenn Ihre Software auf 1.000er Schritten basiert, aber die Hardware in 1.024er Blöcken schreibt, entstehen Verschnitte. In meiner Laufbahn war das oft der Grund für unerklärliche Performance-Einbußen bei High-Speed-Datenbanken. Die Software versuchte, Datenpakete zu schnüren, die nicht perfekt in die physischen Sektoren passten.
Bandbreite versus Speicherkapazität
Ein weiterer Punkt, an dem viel Geld verbrannt wird, ist die Verwechslung von Megabit und Megabyte. Das „b“ und das „B“ machen den Unterschied zwischen einem schnellen Download und einer quälend langsamen Verbindung. Ein Byte besteht aus acht Bit. Wenn Ihr Provider Ihnen 100 Mbit/s verkauft, sind das im Idealfall nur 12,5 MB/s.
Ich habe erlebt, wie ein Unternehmen eine Backup-Lösung für 50 Arbeitsplätze kaufte. Die IT-Abteilung dachte, sie könnten die täglichen Datenmengen innerhalb von zwei Stunden sichern. Sie hatten die Bit-Zahl des Anschlusses durch 1.000 geteilt, um auf die GB zu kommen, und dabei sowohl den Faktor 8 (für die Bits) als auch den Unterschied zwischen dezimaler und binärer Zählung vergessen. Das Ergebnis: Die Sicherung dauerte fast 18 Stunden und blockierte den gesamten Arbeitstag über die Leitung. Die Lösung war nicht etwa eine schnellere Leitung – die war am Standort nicht verfügbar –, sondern eine Änderung der Backup-Strategie auf Block-Ebene. Man muss die Einheiten verstehen, bevor man die Hardware bestellt.
Falsche Speicherplanung in virtuellen Umgebungen
In modernen Rechenzentren arbeiten wir fast nur noch mit Virtualisierung. Hier wird der Fehler bei der Umrechnung besonders gefährlich. Man „überbucht“ oft Ressourcen. Wenn man dabei die Differenz zwischen der Anzeige im Hypervisor (meist binär) und der Abrechnung des Storage-Anbieters (oft dezimal) ignoriert, entstehen „Ghost-Zahlen“.
Stellen Sie sich vor, Sie weisen 100 virtuellen Maschinen jeweils 100 GB Speicher zu. Sie denken, Sie brauchen 10.000 GB, also 10 TB. In der Realität belegen diese Maschinen auf einem binär arbeitenden System deutlich mehr Platz, als die dezimale Rechnung suggeriert. Wenn der physische Speicher voll ist, friert das gesamte Cluster ein. Keine Vorwarnung, kein sanftes Herunterfahren. Einfach Stillstand. Ich habe solche Totalausfälle gesehen, die nur passierten, weil der leitende Techniker den Verschnitt von rund 7,3 % bei der Skalierung von Gigabyte zu Terabyte unterschätzt hatte. Bei großen Clustern reden wir hier nicht von ein paar Euro, sondern von der Stabilität der gesamten Unternehmens-IT.
Software-Limits und alte Dateisysteme
Manche älteren Dateisysteme oder Datenbankformate haben harte Grenzen bei 2 oder 4 GB. Wenn Sie jetzt eine Datei erstellen, die laut Ihrer dezimalen Rechnung 3,9 GB groß ist, könnte sie in einer binären Umgebung bereits die 4-GiB-Grenze sprengen. Das führt zu korrupten Dateien. Das passiert oft beim Export von großen SQL-Dumps oder beim Packen von Archiven.
Ein Kunde wollte eine riesige Log-Datei verarbeiten. Sein Skript brach immer wieder ab. Er war überzeugt, sein Code sei fehlerhaft. Tatsächlich lag es daran, dass das Zielverzeichnis auf einem alten Volume lag, das binär rechnete. Seine Datei war nach seiner Zählung noch im Rahmen, für das Dateisystem aber bereits „zu groß“. Erst als wir den Unterschied zwischen den Maßeinheiten penibel in das Skript einbauten, lief der Prozess durch. Es ist dieser Mangel an Präzision, der Projekte unnötig in die Länge zieht.
Realitätscheck für Ihr Datenmanagement
Erfolg in der IT-Infrastruktur hat nichts mit Hoffnung zu tun. Wenn Sie glauben, dass diese kleinen Unterschiede bei den Einheiten für Sie keine Rolle spielen, haben Sie wahrscheinlich noch nie Verantwortung für ein Budget oder eine kritische Systemverfügbarkeit getragen.
- Rechnen Sie im Zweifel immer mit dem Faktor 1.024. Es ist besser, 7 % zu viel Platz zu haben als 1 % zu wenig.
- Prüfen Sie Ihre Verträge. Steht dort GB, fragen Sie nach, ob 10^9 oder 2^30 Bytes gemeint sind.
- Verlassen Sie sich niemals auf die grafische Anzeige Ihres Betriebssystems ohne Gegenprüfung in der Konsole.
- Planen Sie bei Storage-Systemen immer eine Reserve von mindestens 15 % ein, um Dateisystem-Overhead und Umrechnungsdifferenzen abzufedern.
Es gibt keine magische Abkürzung. Wenn Sie Systeme bauen, die skalieren sollen, müssen Sie die mathematischen Grundlagen Ihrer Hardware akzeptieren. Die Hardware schert sich nicht um Ihr Verständnis von runden Zahlen. Sie arbeitet mit Strom an oder Strom aus, Null oder Eins. Wer das ignoriert, zahlt am Ende drauf – entweder mit Zeit bei der Fehlersuche oder mit echtem Geld beim Cloud-Anbieter. Das ist die Realität in diesem Job. Wer sie nicht akzeptiert, sollte die Finger von der Infrastruktur lassen.