12
Character Set Standards Nicht kodierte Charset Standards Kodierte Charset Standards Internationale Charset Standards

Character Set Standards Nicht kodierte Charset Standards Kodierte Charset Standards Internationale Charset Standards

Embed Size (px)

Citation preview

Page 1: Character Set Standards Nicht kodierte Charset Standards Kodierte Charset Standards Internationale Charset Standards

Character Set Standards

Nicht kodierte Charset Standards

Kodierte Charset Standards

Internationale Charset Standards

Page 2: Character Set Standards Nicht kodierte Charset Standards Kodierte Charset Standards Internationale Charset Standards

Nicht kodierte Charset Standards

Existierten meistens schon lange bevor kodierte Charsets entstehen (oder sogar deren Konzept)

Dienen der Beschränkung und Standardisierung der Zahl der sich in Gebrauch befindlichen chinesischen Zeichen

Didaktische Intention

Page 3: Character Set Standards Nicht kodierte Charset Standards Kodierte Charset Standards Internationale Charset Standards

Hanzi in China

Standardliste 现代汉语通用字表 (7000) Darunter: Grundschule 现代汉语常用字表 (2500) Mittelschule 现代汉语次常用字表 (1000) Zusätzlich: Liste vereinfachter Zeichen 简化字总表 (2249)

Page 4: Character Set Standards Nicht kodierte Charset Standards Kodierte Charset Standards Internationale Charset Standards

Hanzi in Taiwan

Grundliste (4808) Ergänzungsliste (6341) Liste seltener Hanzi (18480) Liste mit Hanzi-Varianten (18609)

Page 5: Character Set Standards Nicht kodierte Charset Standards Kodierte Charset Standards Internationale Charset Standards

Kanji in Japan

Standardliste 常用漢字 (1945) Darunter wichtig: Schulliste 学習漢字 (1006) Zusätzlich: Liste für Namen 人名用漢字 (285)

Page 6: Character Set Standards Nicht kodierte Charset Standards Kodierte Charset Standards Internationale Charset Standards

Hanja in Korea

Gesamtliste 상용한자 / 常用漢字 enthält: Mittelschule (900) Oberschule (900) Zusätzlich Liste für Namen 인명용한자 / 人名用漢字

(2964)

Page 7: Character Set Standards Nicht kodierte Charset Standards Kodierte Charset Standards Internationale Charset Standards

Kodierte Charset Standards

Durch Computersysteme Notwendigkeit von kodierten Charset Standards

Zuerst proprietäre Standards von Unternehmen später nationale Standards

Erster CJKV Standard: JIS C 6226-1978 Methoden zum Arrangieren und Enkodieren werden

von China, Taiwan und Korea übernommen

Page 8: Character Set Standards Nicht kodierte Charset Standards Kodierte Charset Standards Internationale Charset Standards

Chinesische Charset Standards

Nationaler Standard GB ( 国标 ) Grundstandard: GB 2312-80 Wesentliche Kennzeichen: Enthält verschiedene Zeichen anderer Sprachen (nicht

nur ASCII-Zeichen) Level 1 Hanzi (Anordnung nach Lesung) Level 2 Hanzi (Anordnung nach Radikal und

Strichzahl) Folgestandards mit Ergänzungen und Korrekturen

Page 9: Character Set Standards Nicht kodierte Charset Standards Kodierte Charset Standards Internationale Charset Standards

Taiwanesische Charset Standards

Big Five ( 大五 ) , CNS 11643-1986, CCCII CNS zwar offizieller Standard aber Big Five

gebräuchlicher (de-facto Standard) Merkmale: Big Five anfangs stark an JIS angelehnt und kleiner als

CNS Hanzi nach Strichzahl und Radikal geordnet CNS mit Abstand größtes CJKV-Charset Folgestandards bei beiden mit Ergänzungen

Page 10: Character Set Standards Nicht kodierte Charset Standards Kodierte Charset Standards Internationale Charset Standards

Japanische Charset Standards

Fünf verbreitete Charsets in Japan: ASCII JIS-Roman JIS X 0201-1997 (half-width Katakana) JIS X 0208:1997 (und seine Vorgänger) JIS X 0212-1990 (zusätzliche Zeichen) Anmerkung: JIS X 0208:1997 und JIS X 0212-1990

ergänzen sich

Page 11: Character Set Standards Nicht kodierte Charset Standards Kodierte Charset Standards Internationale Charset Standards

Koreanische Charset Standards

Meistverbreiteter Standard: KS X 1001:1993 Wesentliche Merkmale: Enthält ebenfalls Zeichen anderer Sprachen Hangul und Hanja KS X 1001:1991 mit zusätzlichen Hangul-Zeichen KPS 9566-97 von Nordkorea verwendet GB 12052-89 in China verwendet

Page 12: Character Set Standards Nicht kodierte Charset Standards Kodierte Charset Standards Internationale Charset Standards

Internationale Charset Standards

Versuch, die meisten geschriebenen Sprachen der Welt in einem Charset zusammenzufassen

Unicode-Konsortium als bekanntester Vertreter Start mit Unicode 1.0: 20902 chin. Zeichen, 2350

Hangul 5049 andere Zeichen etc. In Folgeversionen Steigerung der Zeichenzahl (aber

nicht der chin. Zeichen) Nationale Standards ordnen sich in den Unicode ein

wie z.B. GB 13000.1-93, JIS X 0221-1995, KS X 1005-1:1995 bzw. Kooperation mit ISO (ISO 10646-1:1993)