gymel  >> Charsets

Zeichentabellen

DOS-Zeichensätze  ·  Windows-Zeichensätze  ·  ISO-8859-Zeichensätze  ·  Bibliothekarische Zeichensätze

Die folgenden Zeichentabellen wurden im wesentlichen aus der Unicode 4.0-Datenbank generiert, unter Zuhilfenahme der Unicode-Zeichentabellen als Orientierung.

Ansicht der Tabellen sollte mit jedem Internet-Browser möglich sein, der hier -->Ā<-- ein A mit einem übergesetzten Balken anzeigen kann. Die meisten Zeichen in den folgenden Tabellen beruhen auf lateinischen Buchstaben, sie können u.U. auch auf Systemen ohne volle Unicode-Unterstützung wie Windows 9x verarbeitet und angezeigt werden, sofern der Browser HTML 4.0-fähig ist und der Darstellungsfont etwa Microsofts WGL4 entspricht (etwa Times New Roman). Durch Einstellen eines Unicode-Fonts (etwa Lucida Sans Unicode oder Bitstream Cyberbit) können allerdings mehr Zeichen dargestellt werden.

Warnung: Die HTML-Tabellen sind sehr umfangreich, auf manchen Systemen hängt sich u.U. der Browser auf!

Codetabellen für MS-DOS

CP 437 DOS Latin US
(von ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/PC/CP437.TXT)
CP 850 DOS Latin 1 (Western Europe)
(von ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/PC/CP850.TXT)
CP 852 DOS Latin 2 (Eastern Europe)
(von ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/PC/CP852.TXT)
natürlich gibt es noch viel mehr davon ...

Codetabellen für MS-Windows

CP 1252 (Win Latin 1)
(von ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/CP1252.TXT,
vgl. http://www.microsoft.com/typography/unicode/1252.htm)
CP 1250 (Win Latin 2)
(von ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/CP1250.TXT,
vgl. http://www.microsoft.com/typography/unicode/1250.htm)
CP 1254 (Win Latin 5)
(von ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/CP1250.TXT,
vgl. http://www.microsoft.com/typography/unicode/1254.htm)
natürlich gibt es noch viel mehr davon ...

ISO-8859 Codetabellen

ISO 8859-1 = Latin 1 (West European)
(von ftp://ftp.unicode.org/Public/MAPPINGS/ISO8859/8859-1.TXT)
ISO 8859-2 = Latin 2 (East European)
(von ftp://ftp.unicode.org/Public/MAPPINGS/ISO8859/8859-2.TXT)
ISO 8859-9 = Latin 5 (Turkish)
(von ftp://ftp.unicode.org/Public/MAPPINGS/ISO8859/8859-9.TXT)
ISO 8859-15 = Latin 9 (Pan European)
(von ftp://ftp.unicode.org/Public/MAPPINGS/ISO8859/8859-15.TXT)
natürlich gibt es noch viel mehr davon ...

Bibliothekarische Zeichensätze

USMARC ANSEL
(von http://lcweb2.loc.gov/cocoon/codetables/45.html,
vgl. auch gopher://marvel.loc.gov:70/00/.listarch/usmarc/96-10.doc)
PICA
(manuell nach http://www.pica.nl/ne/docu/dn010/html/t07.shtml
und nach http://www.gbv.de/winhandb/vers13/diakrit.htm)
allegro Ostwest (DOS-Zeichensatz)
allegro.ttf (Windows-Umsetzung dazu)
(nach http://www.allegro-c.de/)
MAB2 (MAB-ISO-Zeichensatz)
und MAB-Diskette
(manuell nach MAB2-Dokumentation)

Übersichtstabelle (alle Zeichensätze, riesig!)

Diskussion der Verfügbarkeit von Unicode in Internetbrowsern

Konsequenzen für Anwender mit Codepage 850 beim Umstieg auf die Windows-Versionen von allegro

(Rohmaterial für) Umsetzungstabellen (hauptsächlich von und zu MAB und allegro-Ostwest)


Weitere Links für Interessierte:

Unicode Home http://www.unicode.org/
Unicode Font Charts http://www.unicode.org/charts/
Zu den MARC-8-Zeichensätzen: Coded Character Sets by Michael Dorman, Systems Librarian.
Viel Information von Roman Czyborra: http://www.czyborra.com/
Windows Code Pages http://www.microsoft.com/typography/unicode/cscp.htm und Open Type (WGL4) specification http://www.microsoft.com/typography/OTSPEC/WGL4.htm

Liste der Änderungen

17.07.2001:
ISO 8859-15 integriert
10.07.2001:
Unicode u. GBV-Links waren zerbrochen
07.6.2001:
Typos
submit bugs here