[Python-de] Regulaere Ausdruecke in Python

Julian Schaefer-Jasinski julschae at t-online.de
Thu Oct 4 20:40:45 EDT 2001


hi,

ist glaube ich kein wirklich gutes beispiel um sich mit
regular expressions auseinanderzusetzen. hier waere
vielleicht ein einfacher parser vorzuziehen. dennoch -
hier eine moegliche loesung fuer dein problem.

hoffe das hilft ein bisschen.

gruesse,

julian

---->

S
P
O
I
L
E
R
S

B
E
L
O
W

import re

sample_text = """The quarrel is between our masters and us their men.
'Tis all one. I will show myself a tyrant. When I have fought
with the men, I will be cruel with the maids- I will cut off
their heads.
The heads of the maids?
Ay, the heads of the maids, or their maidenheads.
Take it in what sense thou wilt.
They must take it in sense that feel it.
Me they shall feel while I am able to stand; and 'tis known I
am a pretty piece of flesh.
Greg. 'Tis well thou art not fish; if thou hadst, thou hadst been
poor-John. Draw thy tool! Here comes two of the house of
Montagues."""

sentencer = re.compile("[a-zA-Z0-9';,\-\n ]+[.!\?]*")
print len(sentencer.findall(sample_text))

#[a-zA-Z0-9';,\-\n] Gruppe von Zeichen, welche innerhalb eines
#   Satzes vorkommen duerfen. \- (da reserviert)
#   \n um Formatierung zu ignorieren.
#[...]+   weil mindestens ein Zeichen damit Satz.
#
# Programm macht bei "..." im Satz bestimmt Probleme. U. a. deswegen
# einfacher Parser vorzuziehen.


________________________________________________________________
Julian Schaefer-Jasinski  mailto:julschae at usa.net
Frankfurt, Germany




More information about the Python-de mailing list