gymel
>> Charsets
Zeichentabellen
DOS-Zeichensätze
·
Windows-Zeichensätze
·
ISO-8859-Zeichensätze
·
Bibliothekarische Zeichensätze
Die folgenden Zeichentabellen wurden im wesentlichen
aus der Unicode 4.0-Datenbank generiert,
unter Zuhilfenahme der Unicode-Zeichentabellen
als Orientierung.
Ansicht der Tabellen sollte mit jedem Internet-Browser möglich sein,
der hier -->Ā<-- ein A mit einem übergesetzten Balken
anzeigen kann.
Die meisten Zeichen in den folgenden Tabellen beruhen auf lateinischen
Buchstaben, sie können u.U. auch auf Systemen ohne volle
Unicode-Unterstützung wie Windows 9x verarbeitet und angezeigt
werden, sofern der Browser HTML 4.0-fähig ist und der
Darstellungsfont etwa Microsofts WGL4 entspricht (etwa Times New Roman).
Durch Einstellen eines Unicode-Fonts (etwa Lucida Sans Unicode oder
Bitstream Cyberbit)
können allerdings mehr Zeichen dargestellt werden.
Warnung: Die HTML-Tabellen sind sehr umfangreich, auf manchen Systemen
hängt sich u.U. der Browser auf!
Codetabellen für MS-DOS
- CP 437 DOS Latin US
- (von ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/PC/CP437.TXT)
- CP 850 DOS Latin 1 (Western Europe)
- (von ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/PC/CP850.TXT)
- CP 852 DOS Latin 2 (Eastern Europe)
- (von ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/PC/CP852.TXT)
natürlich gibt es noch viel
mehr davon ...
Codetabellen für MS-Windows
- CP 1252 (Win Latin 1)
- (von ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/CP1252.TXT,
vgl. http://www.microsoft.com/typography/unicode/1252.htm)
- CP 1250 (Win Latin 2)
- (von ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/CP1250.TXT,
vgl. http://www.microsoft.com/typography/unicode/1250.htm)
- CP 1254 (Win Latin 5)
- (von ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/CP1250.TXT,
vgl. http://www.microsoft.com/typography/unicode/1254.htm)
natürlich gibt es noch viel
mehr davon ...
ISO-8859 Codetabellen
- ISO 8859-1 = Latin 1 (West European)
- (von ftp://ftp.unicode.org/Public/MAPPINGS/ISO8859/8859-1.TXT)
- ISO 8859-2 = Latin 2 (East European)
- (von ftp://ftp.unicode.org/Public/MAPPINGS/ISO8859/8859-2.TXT)
- ISO 8859-9 = Latin 5 (Turkish)
- (von ftp://ftp.unicode.org/Public/MAPPINGS/ISO8859/8859-9.TXT)
ISO 8859-15 = Latin 9 (Pan European)
(von ftp://ftp.unicode.org/Public/MAPPINGS/ISO8859/8859-15.TXT)
natürlich gibt es noch viel
mehr davon ...
Bibliothekarische Zeichensätze
- USMARC ANSEL
- (von http://lcweb2.loc.gov/cocoon/codetables/45.html,
vgl. auch gopher://marvel.loc.gov:70/00/.listarch/usmarc/96-10.doc)
- PICA
- (manuell nach http://www.pica.nl/ne/docu/dn010/html/t07.shtml
und nach http://www.gbv.de/winhandb/vers13/diakrit.htm)
- allegro Ostwest (DOS-Zeichensatz)
- allegro.ttf (Windows-Umsetzung dazu)
- (nach http://www.allegro-c.de/)
- MAB2 (MAB-ISO-Zeichensatz)
- und MAB-Diskette
- (manuell nach MAB2-Dokumentation)
Übersichtstabelle (alle Zeichensätze, riesig!)
Diskussion der Verfügbarkeit von
Unicode in Internetbrowsern
Konsequenzen für Anwender mit
Codepage 850 beim Umstieg auf die Windows-Versionen von allegro
(Rohmaterial für) Umsetzungstabellen
(hauptsächlich von und zu MAB und allegro-Ostwest)
Weitere Links für Interessierte:
- Unicode Home http://www.unicode.org/
- Unicode Font Charts http://www.unicode.org/charts/
- Zu den MARC-8-Zeichensätzen: Coded Character Sets by Michael Dorman, Systems Librarian.
- Viel Information von Roman Czyborra: http://www.czyborra.com/
- Windows Code Pages http://www.microsoft.com/typography/unicode/cscp.htm und
Open Type (WGL4) specification http://www.microsoft.com/typography/OTSPEC/WGL4.htm
Liste der Änderungen
- 17.07.2001:
- ISO 8859-15 integriert
- 10.07.2001:
- Unicode u. GBV-Links waren zerbrochen
- 07.6.2001:
- Typos
submit bugs here