Upload
mitzi-heitland
View
102
Download
0
Embed Size (px)
Citation preview
Character Set Standards
Nicht kodierte Charset Standards
Kodierte Charset Standards
Internationale Charset Standards
Nicht kodierte Charset Standards
Existierten meistens schon lange bevor kodierte Charsets entstehen (oder sogar deren Konzept)
Dienen der Beschränkung und Standardisierung der Zahl der sich in Gebrauch befindlichen chinesischen Zeichen
Didaktische Intention
Hanzi in China
Standardliste 现代汉语通用字表 (7000) Darunter: Grundschule 现代汉语常用字表 (2500) Mittelschule 现代汉语次常用字表 (1000) Zusätzlich: Liste vereinfachter Zeichen 简化字总表 (2249)
Hanzi in Taiwan
Grundliste (4808) Ergänzungsliste (6341) Liste seltener Hanzi (18480) Liste mit Hanzi-Varianten (18609)
Kanji in Japan
Standardliste 常用漢字 (1945) Darunter wichtig: Schulliste 学習漢字 (1006) Zusätzlich: Liste für Namen 人名用漢字 (285)
Hanja in Korea
Gesamtliste 상용한자 / 常用漢字 enthält: Mittelschule (900) Oberschule (900) Zusätzlich Liste für Namen 인명용한자 / 人名用漢字
(2964)
Kodierte Charset Standards
Durch Computersysteme Notwendigkeit von kodierten Charset Standards
Zuerst proprietäre Standards von Unternehmen später nationale Standards
Erster CJKV Standard: JIS C 6226-1978 Methoden zum Arrangieren und Enkodieren werden
von China, Taiwan und Korea übernommen
Chinesische Charset Standards
Nationaler Standard GB ( 国标 ) Grundstandard: GB 2312-80 Wesentliche Kennzeichen: Enthält verschiedene Zeichen anderer Sprachen (nicht
nur ASCII-Zeichen) Level 1 Hanzi (Anordnung nach Lesung) Level 2 Hanzi (Anordnung nach Radikal und
Strichzahl) Folgestandards mit Ergänzungen und Korrekturen
Taiwanesische Charset Standards
Big Five ( 大五 ) , CNS 11643-1986, CCCII CNS zwar offizieller Standard aber Big Five
gebräuchlicher (de-facto Standard) Merkmale: Big Five anfangs stark an JIS angelehnt und kleiner als
CNS Hanzi nach Strichzahl und Radikal geordnet CNS mit Abstand größtes CJKV-Charset Folgestandards bei beiden mit Ergänzungen
Japanische Charset Standards
Fünf verbreitete Charsets in Japan: ASCII JIS-Roman JIS X 0201-1997 (half-width Katakana) JIS X 0208:1997 (und seine Vorgänger) JIS X 0212-1990 (zusätzliche Zeichen) Anmerkung: JIS X 0208:1997 und JIS X 0212-1990
ergänzen sich
Koreanische Charset Standards
Meistverbreiteter Standard: KS X 1001:1993 Wesentliche Merkmale: Enthält ebenfalls Zeichen anderer Sprachen Hangul und Hanja KS X 1001:1991 mit zusätzlichen Hangul-Zeichen KPS 9566-97 von Nordkorea verwendet GB 12052-89 in China verwendet
Internationale Charset Standards
Versuch, die meisten geschriebenen Sprachen der Welt in einem Charset zusammenzufassen
Unicode-Konsortium als bekanntester Vertreter Start mit Unicode 1.0: 20902 chin. Zeichen, 2350
Hangul 5049 andere Zeichen etc. In Folgeversionen Steigerung der Zeichenzahl (aber
nicht der chin. Zeichen) Nationale Standards ordnen sich in den Unicode ein
wie z.B. GB 13000.1-93, JIS X 0221-1995, KS X 1005-1:1995 bzw. Kooperation mit ISO (ISO 10646-1:1993)