[Python-de] Codierungen in Docutils?

Dinu Gherman gherman at darwin.in-berlin.de
Son Jun 22 11:59:15 EDT 2003


Martin v. Löwis:

> Dinu Gherman <gherman at darwin.in-berlin.de> writes:
>
>> Folgendes erhält immerhin die Codierung. Aber bei Eingabe von 'ascii'
>> oder 'unicode' fuer die Ausgabe kommt ein unschoener UnicodeError...
>
> Wo gibst Du 'ascii' oder 'unicode' ein? Als input_encoding? Da kommt
> natürlich ein UnicodeError - Dein Input ist weder ASCII noch Unicode.
> Wenn man das output_encoding weglässt, wird UTF-8 verwendet, das
> funktioniert doch auch ganz gut, oder?
> Gibst Du 'unicode' als Ausgabe-Encoding an, funktioniert wenigstens
> bei mir der Aufruf von test() problemlos. Erst die Ausgabe mittels
> print scheitert - wenig verwunderlich, weil dazu ja das
> system-encoding verwendet wird, und das ist ASCII. (Genauer gesagt hat
> es bei mir funktioniert, weil ich Python 2.3 verwende, und dort bei
> Ausgabe aufs Terminal das Encoding der locale verwendet wird).

Beim Output gebe ich's ein, Unicode geht auch, nur ausgeben kann man's
halt nicht direkt, soweit richtig.

>> Abgesehen von dem ganzen HTML-Schlunz drumherum in der Ausgabe, den
>> ich auch noch nicht richtig losgeworden bin...
>
> Nun ja, bei einer Ausgabe "als HTML" würde ich schon mit einer
> gewissen Menge HTML-Schlunz rechnen...

Ja und nein, je nachdem, was man will. Ich will nur HTML-Schnipsel
und keine vollstaendigen Dokumente konvertieren. Ein bischen wundert
mich, dass Docutils aus 'abc " 012' das hier macht: "abc &quot; 012",
auch wenn latin-1 im Output-Encoding beibehalten wird, wo ich doch
sehr annehme, dass " auch in Latin-1 enthalten ist... aber egal.

Dinu

--
Dinu C. Gherman
......................................................................
"La vérité est un moyen. Il n'est pas le seul." (Paul Valéry)