ASCII - American Standard Code for Information Interchange

Wer sich schon länger mit EDV und dem Internet beschäftigt, dem ist das Akronym sicher schon mal begegnet. Aber wofür steht die Abkürzung ASCII? Der Begriff bezeichnet eine festgelegte Zeichenkodierung. Sie ordnet druckbaren Zeichen wie Buchstaben, Ziffern und Satzzeichen sowie nicht druckbaren Steuerzeichen bestimmte Codes zu. Man verwendet den ASCII-Code, um die Darstellung der Zeichen durch elektronische Geräte – wie etwa PCs oder Smartphones – festzulegen. Das ist ein wichtiger Bestandteil vieler Programmierarbeiten. Aber auch für den einfachen Anwender ist es sinnvoll, zu verstehen, wie der ASCII-Code funktioniert. Damit Sie den Überblick behalten, liefern wir Ihnen außerdem eine praktische ASCII-Code-Tabelle, in der Sie jedes Zeichen nachschlagen können.

Definition ASCII

Bei der Zeichenkodierung handelt es sich um den American Standard Code for Information Interchange und damit um den US-amerikanischen Vorläufer von ISO 646 (international festgelegte Zeichensätze). ASCII ist ein 7-Bit-Code und somit sind 128 Zeichen (27) definiert. Die Kodierung besteht aus 33 nicht druckbaren und 95 druckbaren Zeichen und umfasst sowohl Buchstaben, Interpunktionszeichen und Ziffern als auch Steuerzeichen.

Geschichte des ASCII-Codes

Die American Standards Association (ASA, inzwischen als ANSI für American National Standards Institute“ bekannt) hat den American Standard Code for Information Interchange (ASCII) bereits im Jahre 1963 genehmigt. Damit hat sie für verbindliche Vorgaben gesorgt, wie elektronische Geräte Zeichen abbilden sollen. Da es sich um einen rein US-amerikanischen Standard handelt, wird auch häufig von US-ASCII gesprochen. Als Vorgänger kann man unter anderem den Morse-Code ansehen – oder auch Kodierungen, die man bei Fernschreiben einsetzt: Ein standardisierter Code (zum Beispiel eine festgelegte Abfolge akustischer Signale) wird dabei in Text übersetzt. Da auch Computer nicht mit unserem Alphabet umgehen können – schließlich basieren ihre internen Vorgänge auf dem binären System – hat man ASCII eingeführt.

Bis heute hat man den Zeichenstandard nur wenige Male verändert, um ihn an neue Anforderungen anzupassen. So existieren zum Beispiel erweiterte Versionen, die ein achtes Bit verwenden, damit auch nationale Eigenheiten – wie etwa die deutschen Umlaute (ä, ö und ü) – dargestellt werden können. Das in Deutschland immer noch beliebte Latin-1 (ISO 88591-1) beruht auf dem ASCII-Code. Ein Wechsel zwischen dem lateinischen Alphabet und zum Beispiel arabischen Schriftzeichen ist allerdings ausgeschlossen. Deshalb haben sich inzwischen weitestgehend auf Unicode basierende Zeichensätze wie UTF-8 durchgesetzt: Unicode bietet Platz für mehr als eine Million verschiedener Zeichen. UTF-8 ist darüber hinaus kompatibel mit ASCII, kodiert also die ersten 128 Zeichen ebenso wie dieser.

Was ist ASCII?

ASCII ist ein Standard zur Darstellung von Zeichen durch elektronische Geräte. Um zu verstehen, was das heißt, muss man sich darüber im Klaren sein, wie ein Rechner überhaupt funktioniert: Bei einem Computer basieren die Rechenprozesse immer auf dem binären System. Das heißt: Einsen und Nullen bestimmen die Vorgänge eines Computers. Deshalb ist auch ASCII auf diesem System aufgebaut. Der ursprüngliche ASCII-Standard definiert innerhalb von sieben Bits – also sieben Stellen, die entweder eine 0 oder 1 zeigen – unterschiedliche Zeichen. Das achte Bit, das zu einem vollen Byte gehört, wird traditionell für Prüfzwecke verwendet. Die auf ASCII basierenden, erweiterten Versionen nutzen genau dieses Bit, um die verfügbaren Zeichen auf 256 (28) zu erweitern.

So entspricht jedem Zeichen eine siebenstellige Folge von Nullen und Einsen, die man als Dezimalzahl oder als hexadezimale Zahl darstellen kann. Die ASCII-Zeichen lassen sich in mehrere Gruppen aufteilen:

  • Steuerzeichen (0–31 & 127): Die Steuerzeichen sind nicht druckbare Zeichen. Sie dienen dazu, Kommandos an den PC oder den Drucker zu übermitteln und beruhen auf Techniken von Fernschreibern. Mit diesen Zeichen werden zum Beispiel Zeilenumbrüche oder Tabulatoren gesetzt. Viele dieser Zeichen sind heute kaum noch in Gebrauch.
  • Sonderzeichen (32–47 / 58–64 / 91–96 / 123–126): Sonderzeichen umfassen alle druckbaren Zeichen, die weder Buchstaben noch Ziffern sind, wie zum Beispiel Satzzeichen oder technisch-mathematische Zeichen. ASCII zählt dazu auch das Leerzeichen, das dort als nicht sichtbares, aber druckbares Zeichen gilt – und das somit nicht zu den Steuerzeichen gehört, wie man vermuten könnte.
  • Ziffern (30–39): Die Ziffern umfassen die zehn arabischen Ziffern von Null bis Neun.
  • Buchstaben (65–90 / 97–122): Die Buchstaben sind in zwei Blöcke unterteilt, wobei die erste Gruppe die Groß- und die zweite die Kleinbuchstaben enthält.
Fakt

Ursprünglich sollte das achte Bit die Überprüfung der Daten auf Fehler ermöglichen. Das sogenannte Paritätsbit erlaubt dem Empfänger der Bitfolge, Ungereimtheiten zu erkennen. Dabei ist allerdings nur ersichtlich, dass ein Fehler aufgetreten ist, jedoch nicht, wo genau die Ursache liegt. Deshalb eignet sich die Paritätsprüfung kaum zur Korrektur von Fehlern.

ASCII-Tabelle: Alle ASCII-Codes im Überblick + PDF-Download

Üblicherweise werden in ASCII-Code-Tabellen die Werte dezimal, binär und hexadezimal dargestellt. Die ersten beiden Arten tauchen auf, da sie die üblicherweise von Menschen beziehungsweise Maschinen verwendeten Zahlensysteme sind. Das Hexadezimalsystem hat hingegen der Vorteil, dass es 16 Zeichen umfasst (0–9 + A–F) und daher große Zahlen mit weniger Stellen darstellen kann als die beiden anderen Varianten. So lässt sich ein Byte immer mit maximal 2 Ziffern darstellen.

Bin. Hex. Dez. ASCII-Zeichen Erläuterung Gruppe
0000000 0 0 NUL Das Nullzeichen fordert das Gerät auf, nichts zu tun. (Null) Steuerzeichen
0000001 1 1 SOH Leitet eine Kopfzeile ein. (Start of Heading) Steuerzeichen
0000010 2 2 STX Beendet die Kopfzeile und markiert den Beginn einer Nachricht. (Start of Text) Steuerzeichen
0000011 3 3 ETX Zeigt das Ende der Nachricht an. (End of Text) Steuerzeichen
0000100 4 4 EOT Markiert das Ende der kompletten Übertragung. (End of Transmission) Steuerzeichen
0000101 5 5 ENQ Eine Anfrage, die eine Rückmeldung fordert. (Enquiry) Steuerzeichen
0000110 6 6 ACK Gibt eine positive Antwort auf eine Anfrage. (Acknowledge) Steuerzeichen
0000111 7 7 BEL Löst ein Tonsignal aus. (Bell) Steuerzeichen
0001000 8 8 BS Lässt den Cursor einen Schritt zurück bewegen. (Backspace) Steuerzeichen
0001001 9 9 TAB (HT) Ein horizontaler Tabulator, der den Cursor innerhalb einer Zeile zur nächsten vordefinierten Position bewegt. (Horizontal Tab) Steuerzeichen
0001010 A 10 LF Führt dazu, dass der Cursor in die nächste Zeile springt. (Line Feed) Steuerzeichen
0001011 B 11 VT Der vertikale Tabulator lässt den Cursor zu einer vordefinierten Zeile springen. (Vertical Tab) Steuerzeichen
0001100 C 12 FF Fordert einen Seitenumbruch. (Form Feed) Steuerzeichen
0001101 D 13 CR Setzt den Cursor zurück an die erste Position der Zeile. (Carriage Return) Steuerzeichen
0001110 E 14 SO Schaltet auf eine besondere Darstellung um. (Shift Out) Steuerzeichen
0001111 F 15 SI Schaltet die Darstellung zurück auf den normalen Zustand. (Shift In) Steuerzeichen
0010000 10 16 DLE Die Bedeutung der nachfolgenden Zeichen wird verändert. (Data Link Escape) Steuerzeichen
0010001 11 17 DC1 Steuerzeichen, die abhängig vom verwendeten Gerät vergeben werden, um spezifische Funktionen auszulösen. (Device Control) Steuerzeichen
0010010 12 18 DC2   Steuerzeichen
0010011 13 19 DC3   Steuerzeichen
0010100 14 20 DC4   Steuerzeichen
0010101 15 21 NAK Negative Antwort auf eine Anfrage. (Negative Acknowledge) Steuerzeichen
0010110 16 22 SYN Synchronisiert eine Datenübertragung, auch wenn keine Signale übertragen werden. (Synchronous Idle) Steuerzeichen
0010111 17 23 ETB Markiert das Ende eines Übertragungsblockes. (End of Transmission Block) Steuerzeichen
0011000 18 24 CAN Macht klar, dass eine Übertragung fehlerhaft war und die Daten verworfen werden müssen. (Cancel) Steuerzeichen
0011001 19 25 EM Zeigt das Ende des Speichermediums an. (End of Medium) Steuerzeichen
0011010 1A 26 SUB Ersatz für ein fehlerhaftes Zeichen. (Substitute) Steuerzeichen
0011011 1B 27 ESC Leitet eine Escape-Sequenz ein und gibt den folgenden Zeichen somit eine gesonderte Bedeutung. (Escape) Steuerzeichen
0011100 1C 28 FS Markiert die Trennung von logischen Datenblöcken und ist hierarchisch geordnet: File als größte, Unit als kleinste Einheit. (File Separator, Group Separator, Record Separator, Unit Separator) Steuerzeichen
0011101 1D 29 GS   Steuerzeichen
0011110 1E 30 RS   Steuerzeichen
0011111 1F 31 US   Steuerzeichen
0100000 20 32 SP Leerzeichen (Space) Sonderzeichen
0100001 21 33 ! Ausrufezeichen Sonderzeichen
0100010 22 34   Gerade Anführungszeichen oben Sonderzeichen
0100011 23 35 # Doppelkreuz Sonderzeichen
0100100 24 36 $ Dollarzeichen Sonderzeichen
0100101 25 37 % Prozentzeichen Sonderzeichen
0100110 26 38 & Kaufmännisches Und Sonderzeichen
0100111 27 39 ' Apostroph Sonderzeichen
0101000 28 40 ( Linke Klammer Sonderzeichen
0101001 29 41 ) Rechte Klammer Sonderzeichen
0101010 2A 42 * Sternchen (Asterisk) Sonderzeichen
0101011 2B 43 + Pluszeichen Sonderzeichen
0101100 2C 44 , Komma Sonderzeichen
0101101 2D 45 - Bindestrich Sonderzeichen
0101110 2E 46 . Punkt (Satzende) Sonderzeichen
0101111 2F 47 / Schrägstrich Sonderzeichen
0110000 30 48 0   Ziffern
0110001 31 49 1   Ziffern
0110010 32 50 2   Ziffern
0110011 33 51 3   Ziffern
0110100 34 52 4   Ziffern
0110101 35 53 5   Ziffern
0110110 36 54 6   Ziffern
0110111 37 55 7   Ziffern
0111000 38 56 8   Ziffern
0111001 39 57 9   Ziffern
0111010 3A 58 : Doppelpunkt Sonderzeichen
0111011 3B 59 ; Semikolon Sonderzeichen
0111100 3C 60 < Kleiner als Sonderzeichen
0111101 3D 61 = Gleichheitszeichen Sonderzeichen
0111110 3E 62 > Größer als Sonderzeichen
0111111 3F 63 ? Fragezeichen Sonderzeichen
1000000 40 64 @ at-Zeichen Sonderzeichen
1000001 41 65 A   Großbuchstaben
1000010 42 66 B   Großbuchstaben
1000011 43 67 C   Großbuchstaben
1000100 44 68 D   Großbuchstaben
1000101 45 69 E   Großbuchstaben
1000110 46 70 F   Großbuchstaben
1000111 47 71 G   Großbuchstaben
1001000 48 72 H   Großbuchstaben
1001001 49 73 I   Großbuchstaben
1001010 4A 74 J   Großbuchstaben
1001011 4B 75 K   Großbuchstaben
1001100 4C 76 L   Großbuchstaben
1001101 4D 77 M   Großbuchstaben
1001110 4E 78 N   Großbuchstaben
1001111 4F 79 O   Großbuchstaben
1010000 50 80 P   Großbuchstaben
1010001 51 81 Q   Großbuchstaben
1010010 52 82 R   Großbuchstaben
1010011 53 83 S   Großbuchstaben
1010100 54 84 T   Großbuchstaben
1010101 55 85 U   Großbuchstaben
1010110 56 86 V   Großbuchstaben
1010111 57 87 W   Großbuchstaben
1011000 58 88 X   Großbuchstaben
1011001 59 89 Y   Großbuchstaben
1011010 5A 90 Z   Großbuchstaben
1011011 5B 91 [ Linke eckige Klammer Sonderzeichen
1011100 5C 92 \ Umgekehrter Schrägstrich („Backslash“) Sonderzeichen
1011101 5D 93 ] Rechte eckige Klammer Sonderzeichen
1011110 5E 94 ^ Zirkumflex Sonderzeichen
1011111 5F 95 _ Unterstrich Sonderzeichen
1100000 60 96 ` Gravis („Backtick“) Sonderzeichen
1100001 61 97 a   Kleinbuchstaben
1100010 62 98 b   Kleinbuchstaben
1100011 63 99 c   Kleinbuchstaben
1100100 64 100 d   Kleinbuchstaben
1100101 65 101 e   Kleinbuchstaben
1100110 66 102 f   Kleinbuchstaben
1100111 67 103 g   Kleinbuchstaben
1101000 68 104 h   Kleinbuchstaben
1101001 69 105 i   Kleinbuchstaben
1101010 6A 106 j   Kleinbuchstaben
1101011 6B 107 k   Kleinbuchstaben
1101100 6C 108 l   Kleinbuchstaben
1101101 6D 109 m   Kleinbuchstaben
1101110 6E 110 n   Kleinbuchstaben
1101111 6F 111 o   Kleinbuchstaben
1110000 70 112 p   Kleinbuchstaben
1110001 71 113 q   Kleinbuchstaben
1110010 72 114 r   Kleinbuchstaben
1110011 73 115 s   Kleinbuchstaben
1110100 74 116 t   Kleinbuchstaben
1110101 75 117 u   Kleinbuchstaben
1110110 76 118 v   Kleinbuchstaben
1110111 77 119 w   Kleinbuchstaben
1111000 78 120 x   Kleinbuchstaben
1111001 79 121 y   Kleinbuchstaben
1111010 7A 122 z   Kleinbuchstaben
1111011 7B 123 { Linke geschweifte Klammer Sonderzeichen
1111100 7C 124 | Senkrechter Strich („Pipe“) Sonderzeichen
1111101 7D 125 } Rechte geschweifte Klammer Sonderzeichen
1111110 7E 126 ~ Tilde Sonderzeichen
1111111 7F 127 DEL Löscht ein Zeichen. Da dieses Steuerzeichen aus derselben Ziffer auf allen Positionen besteht, konnte man in Zeiten von Lochstreifen ein anderes Zeichen ungültig gemacht, indem man alle Stellen ausstanzte. (Delete) Steuerzeichen

Das achte Bit (wenn eine erweiterte Version es nutzt, ansonsten ist es auf null gesetzt) wird von Programm zu Programm unterschiedlich vergeben. In den meisten Fällen verwendet man die zusätzliche Stelle, um länderspezifischen Eigenheiten gerecht zu werden. Die ersten 128 Zeichen bleiben allerdings immer in ihrer ursprünglichen Form erhalten.

Beispiel: ASCII-Zeichen umrechnen

Bei ASCII konvertiert das System Binärzahlen gemäß einem festgelegten Standard, wie er in der obigen Tabelle aufgelistet ist, in druckbare und nicht druckbare Zeichen. Diese Rechenprozesse können Nutzer auch ohne Hilfsmittel durchführen. Dafür müssen Sie nur verstehen, wie man binär oder hexadezimal rechnet. In einem Zahlensystem entspricht jede Stelle der Potenz zu einer bestimmten Basis: Im Dezimalsystem ist die Basis 10. Bei den binären und hexadezimalen Systemen sind die Basen entsprechend 2 beziehungsweise 16. Man multipliziert dann den Wert der Ziffer mit dem Wert der Stelle.

Wert von Stellen im Dezimalsystem:

Dezimalsystem

100

101

102

103

1

10

100

1000

Daher gilt:

7304 = 7 * 10³ + 3 * 10² + 0 * 10¹ + 4 * 10⁰

Analog funktioniert das auch in den beiden anderen Systemen:

Binärsystem

20

21

22

23

1

2

4

8

Allerdings gibt es nur zwei Ziffern, also gilt:

1011 ≙1 * 2³ + 0 * 2² + 1 * 2¹ + 1 * 2⁰ = 11

Hexadezimalsystem

160

161

162

163

1

16

256

4096

Da es 16 Ziffern gibt, gilt:

F1A9 ≙ 15 * 16³ + 1 * 16² + 10 * 16¹ + 9 * 16⁰ = 61865

Mit diesem Wissen und der ASCII-Tabelle lassen sich ASCII-Zeichenfolgen in jedes Zahlensystem umrechnen – hier am Beispiel von „Digital“:

„D“ entspricht in der ASCII-Tabelle dem Dezimalwert 68, also:

68 = 1 * 2⁶ + 1 * 2² ≙ 1000100

68 = 4 * 16¹ + 4 * 16⁰ ≙ 44

„i“ entspricht dem Dezimalwert 105, also:

105 = 1 * 2⁶ + 1 * 2⁵ + 1 * 2³ + 1 * 2⁰ ≙ 1101001

105 = 6 * 16¹ + 9 * 16⁰ ≙ 69

„g“ entspricht dem Dezimalwert 103, also:

103 = 1 * 2⁶ + 1 * 2⁵ + 1 * 2² + 1 * 2¹ + 1 * 2⁰ ≙ 1100111

103 = 6 * 16¹ + 7 * 16⁰ ≙ 67

„i“ entspricht dem Dezimalwert 105, also:

105 = 1 * 2⁶ + 1 * 2⁵ + 1 * 2³ + 1 * 2⁰ ≙ 1101001

105 = 6 * 16¹ + 9 * 16⁰ ≙ 69

„t“ entspricht dem Dezimalwert 116, also:

116 = 1 * 2⁶ + 1 * 2⁵ + 1 * 2⁴ + 1 * 2² ≙ 1110100

116 = 7 * 16¹ + 4 * 16⁰ ≙ 74

„a“ entspricht dem Dezimalwert 97, also:

97 = 1 * 2⁶ + 1 * 2⁵ + 1 * 2⁰ ≙ 1100001

97 = 6 * 16¹ + 1 * 16⁰ ≙ 61

„l“ entspricht dem Dezimalwert 108, also:

108 = 1 * 2⁶ + 1* 2⁵ + 1 * 2³ + 1 * 2² ≙ 1101100

108 = 6 * 16¹ + 12 * 16⁰ ≙ 6C

Demnach lässt sich das Beispielwort auch so darstellen:

Zeichen D i g i t a l
Dez 68 105 103 105 116 97 108
Bin 1000100 1101001 1100111 1101001 1110100 1100001 1101100
Hex 44 69 67 69 74 61 6C
Tipp

Unter Windows können Sie Unicode-Zeichen – und somit auch ASCII-Zeichen – per Tastenkombination eingeben. Halten Sie dafür die Alt-Taste gedrückt und geben Sie über den Nummernblock der Tastatur den Dezimalwert des Zeichens ein.

ASCII-Code: Nutzen und Anwendungsgebiete

Auch heute noch findet ASCII vielfältige Verwendung, wenn auch UTF-8 inzwischen bei der Darstellung von Text wichtiger geworden sein dürfte. Doch erst ab ca. 2008 hat der Unicode die ältere Zeichenkodierung beim Einsatz im World Wide Web von Platz eins verdrängt. Der Vorteil von UTF-8 ist, dass der Code quasi abwärtskompatibel ist: ASCII ist eine Teilmenge von UTF-8 und so sind die ersten 128 Zeichen identisch. Da ASCII als kleinster gemeinsamer Nenner der meisten neueren Kodierungsformen gesehen werden kann, findet die alte Kodierung immer noch Verwendung in E-Mails und URLs.

Fakt

Anwender können inzwischen natürlich auch Unicode bei der Erstellung von E-Mails verwenden, und sogar Domains lassen sich heutzutage dank Internationalized Domain Names mit Umlauten versehen. Vor der Übertragung muss der Text allerdings in beiden Fällen in das ASCII-Format konvertiert werden. Dies geschieht automatisiert, sodass der Nutzer davon nichts mitbekommt.

Darüber hinaus wird ASCII auch seit langem für einen weniger technischen als vielmehr künstlerischen Zweck gebraucht: Als ASCII-Art bezeichnet man Kunst, die ausschließlich druckbare Zeichen der ASCII-Tabelle verwendet, um Bilder zu erzeugen. Die Bandbreite reicht dabei von Schriftzügen über einfache Strichfiguren bis hin zu richtigen Gemälden. Die ASCII-Künstler nutzen dafür die unterschiedlichen Helligkeiten der einzelnen Zeichen aus. So lassen sich sogar Schattierungen darstellen.