(index) (upper index) (framed index) (bounce out)
[FASCINATION] / [LINKFOS] / [COMPUTERTECHNIK] /


Bits und Bytes
Größeneinheiten für Daten



Im Jahre 1980 hat man mit Datenmengen von einigen Kilobyte gearbeitet und innerhalb von 20 Jahren hat sich diese Datenmenge um den Faktor 1'000'000 auf einige Gigabyte erhöht. Was aber bedeuten diese Größenangaben?

Um ein Gefühl für Datenmengen zu bekommen machen wir eine kleine Exkursion in die Weiten der elektronischen Datenverarbeitung und beginnen wir bei den grundsätzlichsten Dingen.
 

Bit - Kleinste Informationseinheit

Beim Computer läßt sich Information nur mittels Einsen und Nullen speichern, denn der Computer kennt nur diese zwei Grundzustände. Jede Information die wir haben müssen wir also aus solchen Einsen und Nullen aufbauen. Diese kleinste Informationseinheit nennt sich Bit. Ein Bit ist also eine Informationsstelle und kann entweder Eins oder Null sein. Das sind nur zwei Möglichkeiten. Nimmt man zwei Bits zusammen ergeben sich vier Kombinationsmöglichkeiten (00,01,10,11) und nimmt man drei zusammen so ergeben sich acht Möglichkeiten (000,001,010,011,100,101,110,111). Und so geht das weiter. Die Anzahl an Kombinationsmöglichkeiten läßt sich leicht rechten indem man für jede weitere Stelle die man hinzunimmt die bisherige Anzahl an Möglichkeiten mit 2 multipliziert. Also ergibt sich die Formel:  "  Möglichkeiten = 2 ^ Stellenzahl  "   (sprich: Möglichkeiten ist gleich zwei hoch Stellenzahl).
 
 
Anzahl Stellen (Bits) Kombinationsmöglichkeiten
1 2
2 4
3 8
4 16
5 32
6 64
7 128
8 = 1 Byte 256
9 512
10 1024
11 2048
12 4096
13 8192
14 16384
15 32768
16 = 2 Byte 65536
... ...

Byte - Grundeinheit von Datenmengen

Diese Zahlenreihe spielt im gesamten Computerbereich eine große Rolle und taucht immer wieder auf, da sich alles aus einzelnen Bits zusammensetzt. Wie oben dargestellt, kann man also mit 8 Bits 256 verschiedene Informationen darstellen. Dies wurde nach einer Konvention zur Basis für eine größere Informationseinheit genommen. So faßt man 8 Bits zu 1 Byte zusammen. Ein einzelnes Byte besteht also eigentlich aus 8 einzelnen Bits. Ein Byte kann dabei 256 verschiedene Werte darstellen. Wie man diese Werte interpretiert ist nun nicht direkt fest gelegt. Man kann die Werte zum Beispiel einfach als Zahlen von 0 bis 255 interpretieren oder als Zahlen von 1 bis 256 oder als Zahlen von -127 bis +128. Das ist pure Auslegungssache. Man kann den Werten oder Zahlen auch Zeichen und Symbole zuordnen. Dann ist jedem Buchstaben und jedem Sonderzeichen ein Zahlenwert zwischen 0 und 255 zugeordnet.

Wir lernen also: 1 Byte sind 8 Bit und dadurch können 256 Werte dargestellt werden.
Wie man diese interpretiert ist nicht festgelegt. Man kann hier aber von "einem Zeichen" sprechen, also z.B. einem einzelnen Buchstaben bei Texten.
 

Viele viele Bytes - Größere Einheiten

Ein Byte ist im Computerbereich eine sehr wichtige Grundgröße. Alle Mengenangaben für Daten beziehen sich heute auf diese Einheit. Natürlich ist ein einziges Byte nicht besonders viel. Es ist ja nur ein einzelner Buchstabe. Ein 200 Zeichen langer Text braucht somit 200 Byte und ein 200.000 Zeichen langer Text braucht 200.000 Byte. Wie auch bei anderen Einheiten (zum Beispiel Gramm oder Meter) kann man zur Vereinfachung Prefixe verwenden um größere Einheiten auszudrücken. Bei Gramm und Meter kennen wir alle die nächst größeren Einheiten Kilogramm und Kilometer. Der Prefix "Kilo" drückt dabei aus, daß es sich um 1000 mal die Grundeinheit handelt. Bei Bytes ist es leider nicht ganz so einfach. Wenn man die obere Tabelle ansieht so findet man den Faktor 1000 hier leider nicht, wohl aber den Faktor 1024. Aus verschiedenen technischen Erwägungen hat man sich deshalb beim Computer entschlossen die Einheit 1 Kilobyte NICHT als 1000 Byte sondern als 1024 Byte zu definieren. Das ist manchmal etwas schwieriger zum Umrechnen jedoch in sich logischer und weniger problematisch. Ein  Kilobyte (kurz: "KB") kann also 1024 Zeichen darstellen (also 1024 Byte). Wem das mit den 1000 und 24 zu kompliziert ist, kann bei ungefähren Rechnungen auch einfach mit 1000 rechnen. Man sollte sich aber bewußt sein, daß dies nicht ganz exakt ist und bei Byte eine Ausnahme für die Umrechnung besteht.
 

Kilo, Mega, Giga, Terra, ...

Bei Computern werden inzwischen so große Datenmengen verarbeitet, daß der Prefix "Kilo" alleine nichtmehr ausreicht. Deshalb werden weitere Prefixe verwendet, die beim Computer jeweils eine um 1024 mal größere Datenmenge beschreiben. Diese Prefixe lauten "Kilo", "Mega", "Giga", "Terra", "Penta", "Exa".
 
 
Prefix Einheit Kurz entspricht Faktor zur Grundeinheit Größenordnung
- Byte B (= 8 Bits) 1024*10^0 =
1
Eins
Kilo Kilobyte KB = 1024 Byte 1024*10^3 =
1'024
Tausend
Mega Megabyte MB = 1024 Kilobyte 1024*10^6 =
1'048'576
Million
Giga Gigabyte GB = 1024 Megabyte 1024*10^9 =
1'073'741'824
Milliarde
Terra Terrabyte TB = 1024 Gigabyte 1024*10^12 =
1'099'511'627'776
Billion
Peta Petabyte PB = 1024 Terrabyte 1024*10^15 =
1,125899906843e+15
Billiarde
Exa Exabyte EB = 1024 Pentabyte 1024*10^18 =
1,152921504607e+18
Trillion
Zetta Zettabyte ZB = 1024 Exabyte 1024*10^21 = Trilliarde
Yota Yotabyte YB = 1024 Yotabyte 1024*10^24 =

 

Was kann man mit einem Megabyte darstellen?

Die Datenmengen werden also sehr schnell sehr gigantisch. Mit einem Megabyte kann man somit über eine Million Zeichen darstellen. Das entspricht so in etwa einem gut 300 Seiten starken Karl May Buch (sagen wir Winetou). Andere Bücher können kleiner sein und haben nur einige hundertausend Zeichen. Der Informationsinhalt den man mit 1 MB speichern kann ist also schon recht beachtlich, oder sagen wir besser: Er KANN recht beachtlich sein. Schließlich könnte man in einem Buch auch 300 Seiten lang nur langweilige Witze erzählen oder einfach zufällig irgendwelche Buchstaben abdrucken. Die Menge sagt also nicht unbedingt etwas über die Qualität aus.
 

Menge ist relativ

Dies zeigt sich auch noch durch einen anderen Grundsatz: Es ist nicht zwingend festgelegt wie wir die Daten interpretieren. Wir können sie als Text interpretieren oder auch als Bild oder Audioaufzeichnung oder als Videoaufzeichnung oder als dreidimensionales Modell oder als Klimadiagramm. Man spricht hier zur Unterscheidung von verschiedenen Datentypen oder Datenformaten. Es gibt eine Vielzahl von Standards die festlegen, wie man Informationen speichern bzw. interpretieren muß um einem bestimmten Datenformat zu genügen und somit zum Beispiel ein Bild zu erhalten. Diese Standards können sehr unterschiedlich sein und ein und das selbe Bild in verschieden viel Information verpacken bzw. das Bild auf vielfache Weise mehr oder weniger gut abspeichern. Ein Standard speichert mehr unterschiedliche Farbneaunce ab, während der andere mehr Bildpunkte pro Milimeter abspeichert. Entsprechend unterschiedlich kann die dafür notwendige Datenmenge sein. Man kann also nicht davon sprechen, daß ein bestimmtes Bild eine bestimmte Menge an Platz benötigt, da dies stark davon abhängt wie man die Bilddaten abspeichert. So kann ein Bild das eine Mal nur 50 KB benötigen und das andere Mal über 1 MB. Trotzdem kann es sein, das der Betrachter zwischen beiden Bildern keinen Unterschied entdeckt. Man könnte daraus also folgern, daß Informationen mehr oder weniger dicht gepackt sein können. Ein identisches Bild kann sich mit 50 KB begnügen oder auf 1 MB ausgedehnt sein. (Natürlich hat es auch qualitative Vorteile ein Bild größer ab zu speichern).
 

Text in nur 7 Bit

Das gleiche gilt auch für Text. Identischer Text kann auf unterschiedliche Weise abgespeichert sein. Bisher sind wir davon ausgegangen, daß ein Buchstabe durch ein Byte dargestellt wird. Das ist aber garnicht notwendig, denn mit einem Byte können wir 265 verschiedene Zeichen darstellen. Ein Text braucht aber nur etwa 60 Zeichen (Buchstaben groß und klein und Satzzeichen, etc.). Das bedeutet wir kämen auch mit nur 6 Bit aus und würden uns damit für jeden Buchstaben 2 Bit sparen, also könnten wir benötigte Speicherplatzgröße um 1/4 reduzieren. Tatsächlich gibt es solche Überlegungen. Man hat sich für Text hier aber auf 7 Bit geeinigt und noch einige Sonderzeichen mehr mit hinzu genommen. Man spart sich trotzdem noch 1/8 der Information ein, was einer Ersparnis um 12,5% entspricht. Die 7 Bit Codierung für Text ist heute die gängige Form der Darstellung. Sie wird verwendet für die sogenannte ASCII Codierung bei der jedem Textzeichen ein Wert zwischen 0 und 127 zugeordnet wird. Daran zeigt sich, daß die Art des Abspeicherns von Informationen fundamental mit bestimmt wieviel Speicherplatz für eine bestimmte Information benötigt wird. Die konsequente Fortführung dieser Überlegung hat zur Entwicklung von Packalgorithmen geführt, die in der Lage sind, Datenmengen durch geschicktes Kodieren zu verkleinern, ohne daß Information verloren geht. Um an die Informationen jedoch wieder heran zu kommen muß zunächst wieder eine Dekodieren durchgeführt werden.
 

Eine ungefähre Größenvorstellung

Die Größe von Daten ist also relativ und variabel. Man kann präzise Aussagen deshalb nur sehr eingeschränkt machen. Dies sollte man im Auge behalten, wenn man mit Datengrößen und Speicherangaben kalkuliert. Trotz dieser Einschränkungen soll nun ein kleiner Überblick darüber gegeben werden wieviel Platz einige unterschiedliche Datenformate verwenden.
 
 
Objekt benötigte Datenmenge in Kilobyte
Ein komplettes dickes Buch 
700 KB
700 KB
Ein komplettes kleineres Buch
300 KB
300 KB
Eine Minute Audioaufzeichung 
(unkomprimiert in CD-Qualität)
10 MB
10240 KB
Eine Minute Audioaufzeichnung 
(schlechte Telefon-Qualität)
1 MB
1024 KB
Eine Minute Audioaufzeichnung 
(hochkomprimierte CD-Qualität)
1 MB
1024 KB
Eine Minute Videoaufzeichnung 
(hochkomprimiert, geringe Qualität)
1 MB
1024 KB
Eine kleine Webgrafik 
(komprimiert, klein)
5 KB
5 KB
Ein großes hochauflösende Bild 
(unkomprimeirt, groß)
5 MB
5120 KB
Ein großes hochauflösende Bild 
(hochkomprimiert, groß)
500 KB
500 KB
Eine Webseite ohne Bilder
15 KB
15 KB
Eine normale kurze Email
5 KB
5 KB
Ein großes Textverarbeitungsprogramm
40 MB
40960 KB
Ein einfaches 3D Modell eines Hauses
300 KB
300 KB
Eine Adressdatenbank 
mit einigen hundert Einträgen
2 MB
2048 KB

Komprimierung als Mittel zum Platzsparen

Man kann also kurz überschlagen: Auch große lange Texte (sowie Webseiten etc.) lassen sich sehr kompakt abspeichern und brauchen nicht viel Platz. Bilder hingegen brauchen schon mehr Platz und werden meist komprimiert um Platz zu sparen. Bei Audioaufzeichnungen und erst recht bei Videoaufzeichnungen wird sehr viel Platz benötigt. Es ist hier absolut erforderlich die Daten zu komprimieren um irgendwie Platz zu sparen. Der unkomprimierte Inhalt einer normalen Audio-CD (ca. 72 Minuten Musik) braucht alleine 650 MB. Komprimiert man diese jedoch (mit entsprechendem Aufwand) braucht diese nurnoch 60 MB. Für die Komprimierung und Dekomprimierung ist eine große Rechenleistung erforderlich. Es kann somit viel Zeit und einen guten Rechner benötigen um Daten zu reduzieren. Zudem lassen sich Daten nicht beliebig reduzieren. Je geschickter und je aufwendiger ein Komprimierungalgorithmus ist, umso besser funktioniert die Komprimierung.
 

Qualitätsverlust durch Komprimierung

Irgendwann ist eine weitere Komprimierung aber nichtmehr ohne Qualitätsverlust möglich. Nimmt man diese Qualitätseinbusen in Kauf, so lassen sich Daten weiter reduzieren. So zum Beispiel indem man bei Text nurnoch Buchstaben abspeichert ohne noch zwischen großen und kleinen Buchstaben zu unterscheiden, oder indem man bei Audioaufzeichnungen nurnoch in Mono aufzeichnet, etc.. Qualitätsverlust bedeutet aber auch, daß hier Informationen verlorengehen, die unter Umständen nicht wieder hergestellt werden können. Treibt man die Reduktion weiter so gehen irgendwann soviele Informationen verloren, daß das Objekt selbst nichtmehr erkennbar ist und die Information somit wertlos wird. Irgendwann kommt man bei der Reduktion zu dem Punkt wo man alles nurnoch mit einem einzige Bit darstellen müßte. Spätestens hier sieht auch der Laie ein, daß man nicht jede beliebige Information der Welt mit dieser extrem stark reduzierten Datenmenge darstellen kann.


www.fascination.de [Interna]
Akutelles, Copyright, Impressum, Kontakt, Support, Gästebuch, Sitemap, Suchen, Credo, Aktionen, Legende, Statistik