41

Vordefinierte Zeichenmengen

HTML ist die Sprache, mit der Webseiten geschrieben werden. In HTML werden Tags immer mit < begonnen und mit > beendet. Dazwischen ist immer Text. Hier kannst du überprüfen, ob die Zeilen invalide HTML-Tags enthalten.

[^<>]* ist normaler Text.

^[^<>]*(</?\w+[^>]*>[^<>]*)*$ habe ich verwendet.

Noam Chomsky hat eine Hirarchie der Grammatiken erstellt. Auf der untersten Ebene sind die regulären Ausdrücke. Die Sprache HTML selbst kann nicht durch einen regulären Ausdruck beschrieben werden. Allerdings sind einzelne Teile der Sprache, wie die Tags, durchaus mit einem regulären Ausdruck beschreibbar.

Nächster Schritt