Homepage-Sicherheit

 

Abi67-Logo

Nur für alle ehemalige Abiturienten des Jahrganges 1963-1967 der EOS "Hermann Pistor" Sonneberg.
Bitte zuerst anmelden!

Zur Zeit online

Aktuell sind 3 Gäste und keine Mitglieder online

Anmeldung

 Inhaltsübersicht

 

6. Die Welt der Zeichencodes

Zeichen kodieren

In der Lektion 5 hast du folgendes erfahren:

  • 1 Bit ist die kleinste Informationseinheit in der EDV
  • 8 Bit werden zu einem Byte zusammengefasst
  • mit 8 Bit können 256 verschiedene Zeichen und Tastaturbefehle kodiert werden
  • 1 Byte entspricht einem druckbaren Zeichen

Aus der 5. Lektion weißt du, dass 106 Zeichen kodiert werden müssen. Das ist der Grundzeichensatz. Da reichen die 256 Möglichkeiten der Kombination  von 8 Bit dicke aus und es bleiben sogar noch welche übrig. Aber da fehlen ja noch die national bedingten Sonderzeichen, die Grafikzeichen, kyrillische Buchstaben, die chinesischen und japanischen, arabischen und und und...
Und noch was wartet auf einen Code: Schau auf deine Tastatur, da gibt die Enter-Taste, die Alt und AltGr-Taste, die Shift-Taste und noch ein paar andere Spezialtasten. Viele senden fertige Computerbefehle an den PC, beispielsweise die Enter-Taste, die sagt, wenn eine Eingabe fertig ist und der Computer sie abarbeiten soll. Wir fassen solche Tasten unter den sogenannten nicht druckbaren Zeichen zusammen. Dazu werden natürlich auch noch ein paar Codes gebraucht. Schluss aber jetzt, ich glaube du weißt worum es geht.

Du wirst dich nun fragen, wie das alles geregelt ist, dass das Ganze weltweit so prima funktioniert. Ein sehr wichtiger Aspekt!

 

Es hat alles seine Ordnung!

Die ASCII-Tabelle

Würde jeder Computerhersteller oder Programmierer seinen eigenen Code benutzen, bräche in der Computerwelt ein Chaos vom Feinsten aus, es würde gar nichts funktionieren. Deshalb haben kluge Köpfe festgelegt, wie welche Zeichen generell zu kodieren sind. Und das in der ganzen Welt.

In den 60er Jahren wurde in den USA eine Vorschrift veröffentlicht, in der festgeschrieben ist, aus welcher Folge von Nullen und Einsen die Computerzeichen bestehen sollen, also wie Ziffern, Buchstaben, Zeichen und Steuerbefehle wie zu kodieren sind. Diese Vorschrift wurde in der sogenannten ASCII-Norm (sprich: äski) festgeschrieben. Sie wurde 1967 als Standard veröffentlicht, 1986 aktualisiert und ist heute die verbindliche Norm zur Kodierung von Computerzeichen.

Die ASCII-Tabelle
Die ASCII-Tabelle enthält alle Computerzeichencodes

Hinweis: Klicke auf das Bild um es vergrößert anzuzeigen.

 

Die ASCII-Tabelle wird ergänzt

1992 erfolge eine wichtige Erweiterung zum ASCII-Zeichensatz: Alle länderspezifischen Besonderheiten, die ab der Codierung 128 aufwärts erfolgten und in speziellen Code-Tabellen existierten, wurden in einer einzigen Tabelle zusammengefaßt und die nennt sich heute "UTF-8" - ausgesprochen "8-bit Universal Character Set Transformation Format". Das 8. Bit was früher als Prüfbit fungierte, hatte damit ausgedient und die Möglichkeiten zur Zeichenkodierung wurde auf einen Schlag verdoppelt. Das Bit 8 wird heute zur "Aufstockung" mit den internationalen Zeichensätzen genutzt.

UTF-8 ist in den ersten 128 Zeichen deckungsgleich mit den "alten" ASCII-Zeichen. Diese eignen sich mit in der Regel 1 Byte Speicherbedarf für Zeichen vieler westlicher Sprachen besonders für die Kodierung englischsprachiger Texte, die sich im Regelfall ohne Modifikation daher sogar mit nicht-UTF-8-fähigen Texteditoren ohne Beeinträchtigung bearbeiten lassen. Das ist auch einer der Gründe für den Status als De-facto-Standard-Zeichenkodierung des Internets und damit verbundener Dokumenttypen. Im April 2017 verwendeten 88,9 % aller Websites UTF-8.

Wer genaueres darüber nachlesen möchte, sei an das Internet verwiesen. Wikipedia gibt schon mal recht ausführlich über diese Art der Kodierung von Zeichen Auskunft. Für unserer Reise in die Welt der Computerdaten ist das jetzt nicht sooo wichtig.

Eine Geheimnis wird gelüftet

Wenn du die Ascii-Tabelle richtig studiert und nicht nur angeschaut hast, dann wird dir folgendes aufgefallen sein und du wirst dir vielleicht folgende Frage gestellt haben: Was bedeuten die Zahlen in der jeweils linken Spalte, also von 000 bis 255?

In der Abbildung beispielsweise 048 entspricht der Ziffer "0" oder 118 steht für den Buchstaben "v".

 

Detail aus der Ascii-Tabelle
Auszug aus der Ascii-Tabelle

 

Hast du auf eine Art laufende Nummer getippt, liegst du noch nicht mal ganz falsch. Die Nummern beginnen komischerweise bei 0 und enden bei 255. Wie soll das verstanden werden?

Nun, neu ist für dich vielleicht, dass in der Computerei Aufzählungen immer mit 0 und nicht mit 1 beginnen. Unverständlich aber wahr, da kommt so mancher aus dem Tritt. Die Tabelle enthält also echt 256 Einträge. Die letzte Zahl endet bei 255, da ab 0 gezählt wird, sind es dann 256.

Ein kleiner Abstecher in die Welt der Zahlen

Die Zahl 256 sollte dir bekannt vorkommen, schau mal zurück in fünfte Lektion! Klar, 256 bedeutet 256 Kombinationsmöglichkeiten bei 8 bit (gezählt wird von 0 bis 255). Hier noch mal zur Erinnerung:

Bits 1 2 3 4 5 6 7 8
Möglichkeiten 2 4 8 16 32 64 128 256

Interessant ist die 2. Zeile "Möglichkeiten": Bei 1 Bit 2 Möglichkeiten,dann 4, dann 8, 16 usw. Mit jedem weiteren Bit verdoppeln sich die Zahlen. Das entspricht der Formel 2 hoch n die angibt, wieviele Möglichkeiten bei n Bit entstehen:
2 hoch 4 (4 Bit) ergibt 16, 2 hoch 8 ergibt 265).

Die Zahlenreihe 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024, 2048, 4096 usw. tauchen in der EDV immer wieder wie magische Zahlen auf. Bei Speicher- und Dateigrößenangaben tauchen sie wieder auch. Wir kommen in Kürze noch einmal darauf zu sprechen.

Soviel erst mal zu dieser recht markanten Zahlenreihe. Zurück zum Thema.

Anliegen war die Klärung der Zahlen von 0 bis 255 in der Ascii-Tabelle. Diese Zahlen stellen den dezimalen Teil der Kodierung des entsprechenden Zeichens dar. Weil sich niemand die Bitfolgen er Zeichen merken kann, wird sie als Dezimalzahl angegeben. Ein Beispiel:
Die Bitfolge des Buchstaben "H" lautet 01001000 - das ist der Binärcode und der entspricht der Zahl 72. Vergleiche mit der Ascii-Tabelle!
Die Buchstaben des Wortes "Hallo" aus unserem Beispiel in Lektion 3 sehen dann so aus:

Buchstabe Binärcode Dezimal
H 01001000 72
a 01101000 97
l 01101100 108
o 01100111 111

Zusammengesetzt würde der Computer das Wörtchen "Hallo" so von der Tastatur empfangen:
0100100001101000011011000110110001100111.
Sieht beeindruckend aus, aber dein PC kann was damit anfangen.

Du wirst nun unschwer erkennen, dass diese 32 Bit (4 Byte) als elektrische Zustände im Computer verarbeit- und speicherbar sind. Das System ist so: 0 - Speicherzelle leer, 1 - Speicherzelle belegt. Das Wort "Hallo" ist im Arbeitsspeicher angekommen und belegt dort 4 Byte. Wie das Ganze abläuft und wo im Arbeitsspeicher diese Informationen genau liegen, brauchen wir nicht zu wiissen. Nur über die beschriebene Art und Weise, wie mit einer Information umgegangen wird, die auf der Tastatur eingetippt wird und in den RAM gelangt, das sollte gezeigt werden.

Die nächste Lektion wird an diesem Punkt anknüpfen und sich etwas mit Zahlensystemen am Computer befassen.

 

Seitenanfang | Inhaltsübersicht

 

 

Bewertung: 0 / 5

Stern inaktivStern inaktivStern inaktivStern inaktivStern inaktiv