HTMLgen und Umlaute

Martin von Loewis martin at mira.isdn.cs.tu-berlin.de
Sun Mar 16 16:04:27 EST 1997


Status: RO

> Weiß jemand, wie ich in HTMLgen vernünftig mit Umlauten (oder sonstigen
> Sonderzeichen) arbeiten kann?

Das Modul htmlentitydefs kennt alle 'besonderen' ISO-8859-1-Zeichen.
Ich habe ein Modul beigefügt, das auf dieser Basis Strings konvertiert:

>>> htmlspecials.toHTML("Tür")
'Tür'

Mein wide-string-Modul
(http://www.informatik.hu-berlin.de/~loewis/python/i18n.html)
wird in der nächsten Version Unicode in HTML umwandeln können.

> Gibt es irgendwo eine Python-Funktion die diese Konvertierung für alle
> möglichen Sonderzeichen vornimmt (für den Mac-Zeichensatz)? Ich habe bei
> mir bis jetzt nur die Umlaute berücksichtigt.

Der Zeichensatz ist zunächst ISO-8859-1. Funktioniert eigentlich das Modul 
htmlentitydefs auf dem Mac?
Wenn mir jemand eine Umrechnungstabelle vom Mac-Zeichensatz in den ISO-Satz 
oder Unicode spendiert, kann man in der nächsten Version des wstring-Moduls
dann auch

import macintosh,htmlspecials
wstring.decode("MACINTOSH","Ein String",).encode("HTML")

sagen. Stimmt eigentlich die MACINTOSH-Tabelle, die mit der GNU-C-Bibliothek 
mitkommt? Dann nehme ich einfach die. Dort heißt es beispielsweise

<A:>                   /x80   <U00C4> LATIN CAPITAL LETTER A WITH DIAERESIS

Korrekt? Und wer verwendet "MAC-IS"? In letzterem is beispielsweise

<th>                   /xDF   <U00FE> LATIN SMALL LETTER THORN (Icelandic)

gegenüber

<fl>                   /xDF   <UFB02> LATIN SMALL LIGATURE FL

Es ist alles eine Frage von ein paar Dictionaries :-)

Ciao,
Martin
______________________________________________________________
   python-de          the German Python mailing list
send messages to:   <mailto:python-de at solar.skyport.net>
list manager: <mailto:owner-python-de at solar.skyport.net>
______________________________________________________________



More information about the Python-de mailing list