Characters/de

From MobileRead
Jump to: navigation, search

Zeichen und Buchstaben bilden die Grundlage für Kommunikation in Schriftform. Technisch gesehen heißen sie Grapheme. In der Computersprache beinhalten Zeichen Buchstaben, Zahlen, Interpunktion und Symbole.

Contents

[edit] Zeichensätze

Ein Zeichensatz ist eine Sammlung von Zeichen. ASCII zum Beispiel ist eine bekannter Zeichensatz der in Computern Verwendung findet. Die grundlegende Speichereinheit in modernen Computern sind Bytes, ein Byte kann 256 Zeichen speichern. Wenn ein Byte zur Speicherung von Zeichen genutzt wird, werden die ASCII Zeichen in die ersten 128 Plätze kodiert, die naderen 128 Plätze können für spezielle Symbole und weitere Zeichen genutzt werden. Die meisten Kodierungsvarianten sind so normiert, daß sie die ersten 128 Plätze zur darstellung von ASCII reservieren um Kompatibilität zu erzeugen. Some encoding schemes are extended beyond 256 locations by using a keycode within to first 256 code to identify that the code set is extended beyond one byte. This technique permits variable byte lengths to represent characters. The computer or electronic device displaying the characters will translate the binary value into graphic representation (glyph) using fonts. Note that a glyph can include more than one character and may change depending on adjacent characters.

Webbrowser und damit HTML Dokumente haben eine fest definierte Anzahl von Zeichensätzen, die unterstützt werden. Einige der beliebten Zeichensätze (auch Zeichenkodierung genannt) sind:

  • Western (ISO-8859-1),
  • Western (ISO-8859-15) - eine Modifikation von -1 um einige Zeichen für Französisch und Finnisch zu unterstützen,
  • Unicode (UTF-8) - Universal für alle Sprachen,
  • Kyrillisch (Windows-1251),
  • Western (Windows-1252),
  • vereinfachtes Chinesisch (GB2312).
  • UTF-16 ist ein oft genutzter Zeichensatz für Kodierungen, der insbesondere asiatische Zeichen enthält.

Um einem Browser zu sagen, welche Art von Zeichen er darstellen soll, wird ein spezieller Eintrag in der Kopfzeile genutzt. Zum Beispiel:

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> 

weist den Browser an, UTF-8 zur Darstellung der Seite zu nutzen.

[edit] Zeicheneingabe

Der einfachste Weg Zeichen einzugeben, ist über die Tastatur. Im allgemeinen ist die gleichzusetzen mit dem ASCII Zeichensatz, oftmals fehlen aber spezielle Zeichen. Um diese Zeichen zu generieren bleibt dem Anwender nichts anderes über, als selber deren Binärcode einzugeben oder ein Menü zu benutzen. In enigen Fällen ist es möglich, gewünschte Zeichen über "Copy&Paste" einzufügen. Für HTML wurden spezielle Wörter-Codes entwickelt, die zur Erstellung eineiger Zeichen genutzt werden können. Diese Wörter-Codes sind dieseleben wie in der obigen Auflistung. Einige zusätzliche special characters werden in dem Link gezeigt.

In der englischen Version von Windows kann man die Zeichen von Windows-1252 einfügen, indem man die Taste Alt drückt und eine Null gefolgt vom dreistelligen Dezimalcode des Zeichens auf dem Nummernfeld eingibt.

[edit] Zeichendarstellung

Ob ein spezielles Zeichen auf dem Bildschirm dargestellt wird, liegt an den Schriften die zur Darstellung genutzt werden. Nicht jeder Schriftsatz wird alle definierten Zeichen darstellen können. Zusätzlich mag ein Zeichensatz den Buchsatben zwar unterstützen, aber an einer anderen Stelle in die Kodierung eingebettet. Aus diesem Grund sehen dargestellte zeichen oftmals anders auch, als erwartet. Dies wissend und nur korrekte Schriften nutzend kann das Problem beseitigen.

Wenn eine Schrift eine spezielles zeichen nicht darstellen kann, wird dieses oft durch ein ? ersetzt. In einigen Fällen wird auch ein Quadrat oder eine andere Grafik angezeigt odr das zeichen wird ignoriert.

[edit] Für mehr Information

Wikipedia on Computer Characters

http://de.wikipedia.org/wiki/Zeichensatz

Personal tools
Namespaces

Variants
Actions
Navigation
MobileRead Networks
Toolbox