Erstellen von Chinesischen Webseiten
Ein Webmaster wird bei der Erstellung einer chinesischen Website auf verschiedene Probleme stoßen, die sowohl kultureller als auch technischer Natur sind. Es ist z.B. durchaus nicht so, dass der chinesische Geschmack bezüglich des Designs oder des Aufbaus dem von Europäern oder Amerikanern entspricht. Der größte Unterschied bezüglich der Technik liegt sicherlich in der Schrift, für die es eine ganz andere Codierung benötigt, als die, die bei Seiten mit Lateinischen Buchstaben verwendet wird.
Codierung – Theorie
Texte, die mit Computer geschrieben werden, basieren auf zwei Grundeinheiten, den Bits und Bytes. Bits können zwei Zustände haben, nämlich 0 und 1. Acht Bits bilden ein Byte, dh. dass ein Byte eine 8-Stellige Zahl ist, die nur aus 0en und 1en besteht (z.B. 01110101). 0 und 1 können zu 256 Verschiedenen achtstelligen Zahlen zusammengesetzt werden (28). Somit gibt es 256 verschiedene Bytes. Ein Byte entspricht einem Zeichen, sei es nun ein Buchstabe oder ein Sonderzeichen wie ä, á oder å.
Die internationale Standardisierungs-Organisation fasste diese 256 Zeichen in eine Tabelle zusammen, die sog. ISO 8859-1 Tabelle, die in Europa weit verbreitet ist und somit die in Europa verwendeten Zeichen einschließt: Das Alphabet, deutsche Umlaute, französische Accent-Zeichen, spanische Zeichen mit Tilde sowie kaufmännische und wissenschaftliche Zeichen. Der Einfachheit halber stehen in dieser Tabelle nicht die genauen Angaben für ein bestimmtes Byte, sondern eine Verkürzung. So wurde für das Byte 01100001 die Zahl 97 festgelegt, welches wiederum als Code für das Zeichen „a“ bestimmt wurde (01100001 = 97 = a).
Nun gibt es aber nicht nur die ISO 8859-1 Tabelle. Weitere Beispiele sind die MS-DOS-Codetabelle und die Windows-Codetabelle. In den verschiedenen Tabellen können zwar gleiche Zeichen vorkommen, denen dann aber evtl. eine verschiedene Codierung zugeordnet wurde, aber auch unterschiedlichen Zeichen, da z.B. MS-DOS und Windows mit verschiedenen Zeichen arbeiten. Somit gibt es ganz verschiedene Tabellen, je nachdem welche Zeichen für einen Besonderen Zweck gebraucht werden.
Nichts anderes tut der Webmaster beim erstellen des Inhalts für eine chinesische Webseite. Zuerst legt er im Quellcode fest, welche Tabelle er verwenden möchte, nämlich die, die die Codierungen für chinesische Zeichen beinhaltet. Somit weis der Browser welche Codierung er verwenden muss, um das Richtige am Bildschirm darzustellen.
Codierung – Umsetzung
Heutzutage wird im Chinesischen zwischen klassischen und modernen Schriftzeichen unterschieden. Klassische werden vor allem noch in Hong Kong und in Taiwan verwendet, während die Festland-Chinesen zu vereinfachten Zeichen übergegangen sind. Somit benötigt es zwei verschiedener Codetabellen. Big5 ist die meistverwendete Codierung traditioneller Zeichen und GuoBiao2312 (GB) ist der populärste Code für moderne Zeichen. Eine dritte, moderne Codetabelle, Unicode, basiert auf einem anderen Prinzip als das oben erklärte und kann die meisten Sprachen dieser Erde in eine Codetabelle zusammen fassen, auch die Codierung für traditionelles wie modernes Chinesisch. Die Beliebtheit von Unicode wächst, google.cn ist z.B. in unicode erstellt.
Welche Codierung der Browser verwenden soll, kann der Nutzer des Browsers in den Browsereinstellungen festlegen. Die meist verbreiteten Browser können dies aber automatisch erkenne, sofern der Webmaster beim Erstellen der Webseite im Quelltext eine Angabe bezüglich der zu verwendeten Codierung gemacht hat. Dies muss mit einem meta-Tag zwischen <head> und </head> passieren. Der zu setzende Code ist folgender:
Für charset_name wird der Name der Codierungstabelle gesetzt, also gb2312 oder big5.
Bei der Erstellung von Europäischen Seiten ist es üblich, mit einem font-Tag die Schriftart festzulegen. Dies ist nicht zu empfehlen, wenn für die europäische sowie die chinesische Version einer Seiten die gleichen Stylesheets verwendet werden, da es passieren kann, dass die gewählte Schriftart keine chinesischen Zeichen unterstützt. Der Internet Explorer kann dies erkennen und eine andere Schriftart einsetzen. Bei anderen Browsern werden evtl. nur lauter Vierecke angezeigt werden.
Chinesisch wurde früher immer, heute nur noch in Taiwan, vertikal geschrieben und somit nicht von links nach rechts sondern von oben nach unten gelesen. Seit Internet Explorer 5.5 gibt es die Möglichkeit, chinesisch auch im Internet vertikal dazustellen.
Wenn der Webmaster zum Erstellen der Seite ein Hilfeprogramm verwendet, z.b. Dreamweaver, kann er in den Einstellungen angeben, welche Codierung zum Schreiben und Wiedergeben des Inhalts verwendet werden soll. Im Beispiel von Dreanweaver geht das unter Modifizieren -> Seiteneigenschaften -> Titel/Kodierung und dort die entsprechende Codierung auswählen.
Zum Schluss noch ein paar Beispiele beliebter chinesischer Seiten:
– www.sina.com.cn
– www.sohu.com
– www.tom.com
– www.163.com
– www.etang.com
Grundsätzlich empfehle ich inzwischen die Erstellung von Webseiten in unicode, um Probleme mit der Codierung z.B. bei mehrsprachigen Projekten zu vermeiden