Previous Next Contents

2. Rüstzeug und generelle Bemerkungen

2.1 Warum sind deutsche Anpassungen notwendig?

Linux wird von einer weltweiten Gemeinde von Hackern im Internet entwickelt. Obwohl Linux ursprünglich aus Finnland kommt, ist Englisch gemeinsame Sprache und Ausgangspunkt bei der Programmierung sind meist amerikanische Standards (Papierformat "letter", Zeichensatz ohne Umlaute, usw.).

Gerade weil die Linux-Gemeinde weltweit operiert, sind landesspezifische Einstellungen an vielen Stellen vorgesehen und müssen lediglich aktiviert werden. Das ist schon alles.

2.2 Notation

Tasten werden durch ihre Aufschrift in spitzen Klammern markiert.

2.3 Empfohlene Begleitliteratur

Das Linux Configuration-HOWTO (to appear) erläutert die Handhabung der erwähnten Konfigurationsdateien.

Im Linux Keyboard- und Keystroke-HOWTO findet man alle "Tricks" für die Tastatur.

2.4 Kurzes Glossar

ASCII

ist ein 7-bit Zeichensatz und enthält 2^7 = 2*2*2*2*2*2*2 = 128 Zeichen, was gerade mal für a-z, A-Z, 0-9 und einige wichtige Zeichen ausreicht. Das amerikanische Alphabet halt.

8-bit-clean

ein 8-bit Zeichensatz umfaßt 128*2 = 256 Zeichen und kann einige Sonderzeichen aufnehmen. Ist ein Programm in der Lage mit einen 8-bit Zeichensatz umzugehen, so bezeichnet man es auch als `8-bit clean'. Ist ein Programm nicht 8-bit clean, so erscheinen oft anstelle der Umlaute `äöü' die Zeichen `dv|'.

Man beachte den subtilen Unterschied zwischen `8bit clean' und `localized': Ein 8bit cleanes Programm braucht nichts von seiner Locale (und dem verwendeten Zeichensatz!) zu wissen; es muss ``nur'' alle 256 Zeichen bearbeiten können. Handkehrum kann ein Programm localized sein, aber trotzdem nicht 8bit clean sein, da es gewisse Zeichen verschluckt (z.B. alle Control-Codes).

`ISO-latin1' oder `ISO-8859-1'

Internationaler 8-bit Zeichensatz, enthält Umlaute und viele Sonderzeichen für die `westeuropäischen' Sprachen. (Die osteuropäischen und weitere haben andere Endziffern.)

Unicode

Unicode ist ein Standard, der Zeichen aus den unterschiedlichsten Sprachen der Länder dieser Welt enthält. Dazu werden die Zeichenpositionen in einem 32-bit Zeichensatz definiert, was noch längst nicht abgeschlossen ist. Gängigere Zeichensätze (wie die Zeichen der europäischen Sprachfamilien) sind als 16-bit Untergruppen festgelegt, die in kompatibler Weise als einzelne 16-bit Unicode-Zeichensätze verwendet werden können. Wenn hier von einem Unicode-Zeichensatz die Rede ist, ist die 16-bit Untergruppe der europäischen Sprachfamilien gemeint.

POSIX

POSIX steht für `Portable Operating System Interface for UniX'. Normierte Schnittstellenbeschreibung zu Kernel- und libc-Funktionen (POSIX.1) resp. zu den Grundutilities (sh, ed, vi, awk, cut, ...) (POSIX.2).

Locale

Ist die formale Beschreibung eines Teils der kulturellen Eigenheiten für ein Land oder einen Spracheraum und die vom jeweiligen Programm benötigten übersetzten Texte.

Internationalization

Veränderung eines Programms zur Unterstützung mehrerer Sprachen.

i18n

Abkürzung für internationalization. Da viele Leute zu faul waren dieses lange Wort immer wieder auszuschreiben, wurden einfach der erste und letzte Buchstabe belassen und der Zwischenraum durch die Anzahl fehlender Buchstaben ersetzt.

Localisation

Mit localisation wird der Prozeß bezeichnt, einem bereits internationalisierten Programm alle benötigten Informationen zur Verfügung zu stellen, um den nationalen Besonderheiten, bezüglich der Sprache und kulturellen Umfeld zu entsprechen. Kurz gesagt, i18n ist der eigentliche Übersetzungsprozeß.

Der Nutzer kann das lokalisieren eines Programms erreichen, indem er besonderen Umgebungsvariablen geeignete Werte zuweist, welche die zu benutzende `locale' angeben.

l10n

Abkürzung für localization, die wie i18n entstanden ist.


Previous Next Contents