vorlesungsskript - tcs.uni-luebeck.de · vorlesungsskript theoretische informatik wintersemester...

VorlesungsskriptTheoretischeInformatikWintersemester 200912. Februar 2010

Till TantauInsitut fr Theoretische Informatik CT SUniversitt zu Lbeck

THEORETISCHEINFORMATIK

SPRACHKLASSENMASCHINEN-

MODELLEGRAMMATIKEN

LOGISCH-ALGEBRAISCHE

BESCHREIBUNG

AUTOMATEN-THEORIE

KOMPLEXITTS-THEORIE

REKURSIONS-THEORIE

regulreSprachen

E-Mail-Adressen

URLs

Bezeich-ner

EndlicheAutomaten

DFA

NFA

2NFA

regulreGrammatiken

linkslinear

rechts-linear

Normal-form

regulreAusdrcke

Nerode-Klassen

kontextfreieSprachen

linear-kontextfrei

DCFL

CFL

HTMLXML-

Instanzen

Programm-text-

struktur

Keller-automaten

determi-nistisch

nicht-determi-nistisch

kontextfreieGrammatiken

linear

determi-nistisch

Greibach-normal-form

Chomsky-normal-form

Zeit- undPlatz-Klassen

Reduk-tionen

Abge-schlossen-

heit

Voll-stndigkeit

PSPACE

Strategie-Spiele

NP

Erfllbar-keit vonFormeln

P

Schalt-kreise

auswerten

L und NL

Erreich-barkeit inGraphen

ressource-beschrnkte

Turingmaschine

platz-beschrnkt

polyno-miell

linear

logarith-misch

zeit-beschrnkt

nichtdet.polyno-miell

det.polyno-miell

kontext-sensitiveGram-matiken

endlicheModelle vonlogischenFormeln

entscheidbareSprachen

primitiv-rekursiv

rekursiv

unentscheid-bare Sprachen

rekursivauf-

zhlbar

nichtrekursiv

Turing-Maschine

Register-Maschine

imperativeProgramme

LOOP-Program-

me

WHILE-Program-

me

allgemeineGrammatiken

unendlicheModelle vonlogischenFormeln

Rekursions-formeln

primitiveRekursion

-Rekursion

THEO

RET

ISCHE

INFO

RM

ATIK

SPRACHKLA

SSEN

MASC

HIN

EN-

MODEL

LEG

RAM

MATIKEN

LOGIS

CH-

ALG

EBRAIS

CHE

BESC

HREIBUNG

AUTO

MATE

N-

THEO

RIE

KOM

PLEX

ITTS-

THEO

RIE

REK

URSI

ONS-

THEO

RIE

regu

lre

Sprach

en

E-Mail-

Adressen

URLs

Beze

ich-

ner

Endliche

Autom

aten

DFA

NFA

2NFA

regu

lre

Grammatiken

linkslin

ear

rech

ts-

linea

r

Normal-

form

regu

lre

Ausdrc

keNerod

e-Klas

sen

kontex

tfreie

Sprach

en

linea

r-ko

ntex

tfrei

DCFL

CFL

HTM

LXM

L-Instan

zen

Prog

ramm-

text-

struktur

Kelle

r-au

tomaten

determ

i-nistisc

h

nich

t-de

term

i-nistisc

h

kontex

tfreie

Grammatiken

linea

r

determ

i-nistisc

h

Greibac

h-no

rmal-

form

Cho

msky-

norm

al-

form

Einfh

rung

zur

Komplex

itts-

theo

rie

Redu

k-tio

nen Abg

e-schlos

sen-

heit

Voll-

stn

digk

eit

PSPA

CE

Strategie-

Spiele

NP

Erfllb

ar-

keitvo

nFo

rmeln

P

Scha

lt-kreise

ausw

erten

Lun

dNL

Erreich-

barkeitin

Graph

en

ressou

rce-

beschrn

kte

Turin

gmas

chine

platz-

beschrn

kt

polyno

-miell

linea

r

loga

rith-

misc

h

zeit-

beschrn

kt nich

tdet.

polyno

-miell

det.

polyno

-miell

kontex

t-sensitive

Grammati-

ken

endliche

Mod

elle

von

logische

nFo

rmeln

entsch

eidb

are

Sprach

en

prim

itiv-

reku

rsiv

reku

rsiv

unen

tsch

eid-

bare

Sprach

en

reku

rsiv

aufzh

l-ba

r nicht

reku

rsiv

Turin

g-Mas

chine

Register-

Mas

chine

impe

rativ

eProg

ramme

LOOP-

Prog

ram-

me W

HILE-

Prog

ram-

me

allgem

eine

Grammatiken

unen

dliche

Mod

elle

von

logische

nFo

rmeln

Reku

rsions-

form

eln

prim

itive

Reku

rsion -

Reku

rsion

Veran

staltung

skarte

Wintersem

ester20

09

Veran

staltung

sziele

Th

eoretisch

eGrund

lage

nde

rSy

ntax

undde

rop

erationa

lenSe

man

tikvo

nProg

rammiersprac

henke

nnen

Mg

lichk

eitenun

dGrenz

ende

rInform

atik

verstehe

nAlgorith

misc

heProb

lememod

ellie

renun

dmitge

eign

eten

Werkz

euge

nlsen

knn

enAlgorith

misc

heProb

lemena

chihrerKo

mplex

ittk

lassifizieren

knn

en

15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

Nov

embe

r20

091 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

Dez

embe

r20

091 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

Janu

ar20

101 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

Februa

r20

101 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28Syntaxbeschreibung WieanalysiertmanSyntax? Wasistberechenbar? WieschwierigsindProbleme?

Einfh

rung

,Organ

isatoris

ches

1Alpha

bet,W

ort,Sp

rach

eMathe

matisc

heObjek

tealsW

orte

kodieren

knn

enEn

tsch

eidu

ngsp

roblem

ealsSp

rach

enform

alisieren

knn

enGrund

operatione

nau

fSprac

henan

wen

den

knn

en

Alpha

bet,W

ort,Sp

rach

e

2Grammatiken

Be

griffede

rRe

gelu

ndde

rAbleitung

verstehe

neinfac

heSy

ntax

prob

lememittelsGrammatiken

beschreibe

nk

nnen

Ko

rrek

theitsbe

weise

fhren

knn

en

Grammatiken

3Die

Cho

msky-Hierarchie

Stufen

derHierarchieke

nnen

Grammatiken

derric

htigen

Stufezu

ordn

enk

nnen

Sp

rach

klas

senun

dAbg

esch

lossen

heitve

rstehe

n

Die

Cho

msky-Hierarchie

4Deterministisc

heen

dliche

Autom

aten

Sy

ntax

undSe

man

tikvo

nDFA

sbe

herrsche

n

XM

L-Fragm

ente

mittelsDFA

sbe

schreibe

nk

nnen

DFA

sim

plem

entie

renk

nnen

Deterministisc

heen

dliche

Autom

aten

5Grenz

enregu

lrerSp

rach

enAussa

gede

sPu

mping

-Lemmas

frregu

lre

Sprach

enve

rstehe

nDas

Pumping

-Lemmaan

wen

denk

nnen

,um

Nichtregu

laritt

zube

weisen

Grenz

enregu

lrerSp

rach

en

6Nichtde

term

inistisc

heen

dliche

Autom

aten

Sy

ntax

undSe

man

tikvo

nNFA

sbe

herrsche

nqu

ivalen

zbew

eiszu

DFA

sve

rstehe

n

Nichtde

term

inistisc

heen

dliche

Autom

aten

7Zw

ei-W

ege-Autom

aten

Sy

ntax

undSe

man

tikvo

n2-N

FAsbe

herrsche

nqu

ivalen

zbew

eiszu

DFA

sve

rstehe

nqu

ivalen

zbew

eiszu

regu

lrenGrammatiken

verstehe

n

Zwei-W

ege-Autom

aten

8Re

gulre

Ausdrc

keVerschied

eneSy

ntax

-Varianten

kenn

enSe

man

tikregu

lrerAusdrc

keve

rstehe

nSy

ntax

prob

lememittelsregu

lrerAusdrc

kebe

schreibe

nk

nnen

qu

ivalen

zbew

eiszu

regu

lrenSp

rach

enve

rstehe

n

Regu

lre

Ausdrc

ke

9Nerod

e-Klas

sen

Be

griffede

sInde

xun

dde

rInva

rianz

verstehe

nDen

Inde

xeine

rSp

rach

ebe

stim

men

knn

enDen

Satz

vonMyh

ill-N

erod

eun

dseinen

Beweis

verstehe

nAutom

aten

minim

ierenk

nnen

Nerod

e-Klas

sen

10Ko

ntex

tfreieGrammatiken

Be

ispiele

kontex

tfreier

Sprach

enke

nnen

ko

ntex

tfreieAnteile

vonSp

rach

enau

sde

rPrax

isiden

tifizieren

knn

enPu

mping

-Lemmafrko

ntex

tfreieSp

rach

eve

rstehe

nun

dan

wen

denk

nnen

Normalform

enfrko

ntex

tfreieSp

rach

enke

nnen

Kontex

tfreieGrammatiken

11Ana

lyse

kontex

tfreier

Sprach

enDen

Algorith

mus

vonCoc

ke,Y

oung

erun

dKa

samia

nwen

denk

nnen

Sy

ntax

undSe

man

tikvo

nPu

shdo

wn-Autom

aten

verstehe

nqu

ivalen

zzu

kontex

tfreien

Grammatiken

kenn

enKo

nzep

tder

determ

inistisc

hko

ntex

tfreien

Grammatik

verstehe

n

Ana

lyse

kontex

tfreier

Sprach

en

12Mas

chinen

I:Die

Turin

gmas

chine

Sy

ntax

undSe

man

tikde

rTu

ringm

asch

ine

verstehe

nBe

griff

derKo

nfigu

ratio

nve

rstehe

neinfac

heTu

ringm

asch

inen

erstellenk

nnen

Ko

rrek

theitsbe

weise

fhren

knn

enKlas

sende

ren

tsch

eidb

aren

undde

rau

fzh

lbaren

Sprach

enke

nnen

Mas

chinen

I:Die

Turin

gmas

chine

13Mas

chinen

II:Nichtde

term

inism

usNichtde

term

inism

usbe

iTuringm

asch

inen

verstehe

n

NTM

sen

twerfenk

nnen

Ko

nzep

tdes

nichtde

term

inistisc

henRa

tens

verstehe

nqu

ivalen

zbew

eiszu

determ

inistisc

hen

Mas

chinen

kenn

en

Mas

chinen

II:Nichtde

term

inism

us

14Mas

chinen

III:R

egister-M

asch

inen

Sy

ntax

undSe

man

tikde

rRAM

verstehe

nEinfac

heRAM-Program

meschreibe

nk

nnen

qu

ivalen

zbew

eiszu

Turin

gmas

chinen

verstehe

n

Mas

chinen

III:R

egister-M

asch

inen

15Prog

rammeI:

LOOP-un

dW

HILE-Prog

ramme

Sy

ntax

undSe

man

tikvo

nLO

OP-un

dW

HILE-Prog

rammen

verstehe

nqu

ivalen

zbew

eiszu

Turin

gmas

chinen

verstehe

n

Prog

rammeI:

LOOP-un

dW

HILE-Prog

ramme

16Prog

rammeII:

Reku

rsion

Sy

ntax

undSe

man

tikde

nprim

itive

nun

dde

r-Rek

ursio

nve

rstehe

nKlee

nesche

Normalform

kenn

enqu

ivalen

zbew

eiszu

LOOP-un

dW

HILE-Prog

rammen

verstehe

n

Prog

rammeII:

Reku

rsion

17Die

Chu

rch-Tu

ring-Th

ese

Gesch

ichtede

rTu

ringm

asch

ineke

nnen

Aussa

gede

rChu

rch-Tu

ring-Th

eseke

nnen

Be

griff

derT

uring-Mc

htigke

itke

nnen

Die

Chu

rch-Tu

ring-Th

ese

18Une

ntsche

idba

rkeitI:

Das

Halteprob

lem

Das

Halteprob

lem

verstehe

nDen

Beweisde

rUne

ntsche

idba

rkeitv

ersteh

enEige

neUne

ntsche

idba

rkeitsbe

weise

fhren

knn

enAufba

uun

dFu

nktio

neine

run

iverselle

nTu

ringm

asch

ineve

rstehe

n

Une

ntsche

idba

rkeitI:D

asHalteprob

lem

19Une

ntsche

idba

rkeitII:Sa

tzvo

nRice

Den

Satz

vonRice

undseinen

Beweisve

rstehe

nKo

nseq

uenz

enfrprak

tisch

eProb

lemstellung

enke

nnen

Den

Reku

rsionssa

tzun

dde

nFixp

unktsa

tzke

nnen

Une

ntsche

idba

rkeitII:Sa

tzvo

nRice

20Une

ntsche

idba

rkeitIII:

Une

ntsche

idba

reProb

leme

Das

Postsche

Korrespo

nden

zproblem

kenn

enDas

Busy-Bea

ver-P

roblem

kenn

enDas

Konz

eptd

erKo

lmog

orov

-Kom

plex

itt

kenn

en

Une

ntsche

idba

rkeitIII:

Une

ntsche

idba

reProb

leme

21Die

O-N

otation

Defi

nitio

nve

rsch

iede

nerVarianten

der

O-N

otationve

rstehe

nFu

nktio

nenan

hand

ihrerO-Klassen

klas

sifizieren

knn

enW

ichtigeO-Klassen

ihrVerh

ltniske

nnen

DieO-N

otation

22Einfh

rung

zurKo

mplex

ittstheo

rieKo

nzep

tder

zeit-

undplatzb

esch

rnk

ten

Turin

gmas

chineve

rstehe

nW

ichtigede

term

inistisc

heZe

it-un

dPlatzk

lassen

kenn

enSp

rach

enin

dieZe

it-Platz-Hierarchieeino

rdne

nk

nnen

Einfh

rung

zurKo

mplex

ittstheo

rie

23Die

Idee

derRe

duktion

Ko

nzep

tder

Redu

ktionallgem

einve

rstehe

nDefi

nitio

nde

rLo

gspa

ce-M

any-One

-Red

uktio

nve

rstehe

nRe

duktione

nerstellenk

nnen

Die

Idee

derRe

duktion

24Die

Idee

derVollstn

digk

eit

Die

Zeit-Platz-Hierarchieke

nnen

Ko

nzep

tder

Schw

ereve

rstehe

nKo

nzep

tder

Vollstn

digk

eitv

ersteh

enW

ichtigke

itde

rTran

sitivit

tvon

Redu

ktione

nke

nnen

Die

Idee

derVollstn

digk

eit

25NL-V

ollstn

digk

eit

Nichtde

term

inistisc

henPlatzve

rstehe

nDas

Erreichb

arke

itsprob

lem

REA

CHke

nnen

Bo

otstrapp

ing-

undRe

duktionsmetho

deke

nnen

Be

weisde

rNL-V

ollstn

digk

eitv

onREA

CH

verstehe

nEige

neNL-V

ollstn

digk

eitbew

eise

fhren

knn

en

NL-V

ollstn

digk

eit

26P-Vollstn

digk

eit

Mathe

matisc

heDefi

nitio

nvo

nSc

haltk

reise

nke

nnen

Das

Circ

uit-V

alue

-Problem

CVPke

nnen

Be

weisde

rP-Vollstn

digk

eitv

onCVPve

rstehe

n

P-Vollstn

digk

eit

27NP-Vollstn

digk

eit

Nichtde

term

inistisc

heZe

itve

rstehe

nDas

Erfllb

arke

itsprob

lem

SATke

nnen

Sa

tzes

vonCoo

kun

dseinen

Beweisve

rstehe

n

NP-Vollstn

digk

eit

28Das

P-NP-Prob

lem

Ko

nzep

tdes

Klas

senk

ollaps

verstehe

nMeh

rere

NP-vo

llstnd

igeProb

lemeke

nnen

Die

Bede

utun

gde

rP-NP-Frag

eeinsch

tze

nk

nnen

Grnd

eke

nnen

,wesha

lbdieFrag

eso

schw

ierig

zulsenist

Das

P-NP-Prob

lem

Klau

sur

C TS

Prof.D

r.TillTa

ntau

www.tc

s.un

i-lue

beck.de

Fassun

gvo

m1.

Februa

r20

10

1

Inhaltsverzeichnis iii

Inhaltsverzeichnis

Vorwort . . . . . . . . . . . . . . . . . . . . . . . 1

Teil ISyntaxbeschreibung

1 Alphabet, Wort, Sprache1.1 Zur Einstimmung 6

1.2 Wie formalisiert man Probleme? 71.2.1 Probleminstanzen sind Worte . . . . . . 71.2.2 Operationen auf Worten . . . . . . . . . 91.2.3 Probleme sind Sprachen . . . . . . . . . 101.2.4 Operationen auf Sprachen . . . . . . . . 12

bungen zu diesem Kapitel 13

2 Grammatiken2.1 Einleitung 162.1.1 Grammatiken fr natrliche Sprachen . 162.1.2 Grammatiken fr Programmiersprachen 17

2.2 Formale Grammatiken 182.2.1 Definition: Regeln . . . . . . . . . . . . 182.2.2 Definition: Ableitungen . . . . . . . . . 192.2.3 Korrektheitsbeweise . . . . . . . . . . . 21


3 Die Chomsky-Hierarchie3.1 Grammatik-Arten 263.1.1 Regulr . . . . . . . . . . . . . . . . . . 263.1.2 Kontextfrei . . . . . . . . . . . . . . . . 273.1.3 Kontextsensitiv . . . . . . . . . . . . . 28

3.2 Die Chomsky-Hierarchie 293.2.1 Sprachklassen . . . . . . . . . . . . . . 293.2.2 Stufen der Hierarchie . . . . . . . . . . 293.2.3 Abgeschlossenheit . . . . . . . . . . . . 303.2.4 Einordnung typischer Probleme . . . . . 31


Teil IIWie analysiert man Syntax?

4 Deterministische endlicheAutomaten

4.1 Motivation von endlichen Automaten 364.1.1 Motivation I . . . . . . . . . . . . . . . 364.1.2 Motivation II . . . . . . . . . . . . . . 36

4.2 Endliche Automaten 374.2.1 Syntax . . . . . . . . . . . . . . . . . . 374.2.2 Semantik . . . . . . . . . . . . . . . . . 394.2.3 Implementation . . . . . . . . . . . . . 414.2.4 Korrektheitsbeweise . . . . . . . . . . . 42

4.3 Verhltnis zu regulren Sprachen I 42


iv Inhaltsverzeichnis

5 Grenzen regulrer Sprachen5.1 Das Pumping-Lemma 475.1.1 Vorbereitende berlegungen . . . . . . 475.1.2 Der Satz und sein Beweis . . . . . . . . 48

5.2 Anwendungen 495.2.1 Das Spiel . . . . . . . . . . . . . . . . 495.2.2 Nichtregularitt . . . . . . . . . . . . . 50


6 Nichtdeterministischeendliche Automaten

6.1 Nichtdeterministische Automaten 546.1.1 Idee . . . . . . . . . . . . . . . . . . . 546.1.2 Syntax . . . . . . . . . . . . . . . . . . 556.1.3 Semantik . . . . . . . . . . . . . . . . . 556.1.4 Korrektheitsbeweise . . . . . . . . . . . 58

6.2 Umwandlung in deterministischeAutomaten 58

6.2.1 Die Idee . . . . . . . . . . . . . . . . . 586.2.2 Die Konstruktion . . . . . . . . . . . . 606.2.3 Der Satz . . . . . . . . . . . . . . . . . 61


7 Zwei-Wege-Automaten7.1 -NFAs 647.1.1 Syntax . . . . . . . . . . . . . . . . . . 647.1.2 Semantik . . . . . . . . . . . . . . . . . 647.1.3 Mchtigkeit . . . . . . . . . . . . . . . 65

7.2 2-Wege-NFAs 657.2.1 Syntax . . . . . . . . . . . . . . . . . . 667.2.2 Semantik . . . . . . . . . . . . . . . . . 667.2.3 Mchtigkeit . . . . . . . . . . . . . . . 67

7.3 Verhltnis zu regulren Sprachen II 70


8 Regulre Ausdrcke8.1 Die Idee 748.1.1 Neue Probleme aus alten . . . . . . . . 748.1.2 Analogie zu arithmetischen Ausdrcken 74

8.2 Die Theorie 758.2.1 Syntax . . . . . . . . . . . . . . . . . . 758.2.2 Semantik . . . . . . . . . . . . . . . . . 758.2.3 Mchtigkeit I: Im Westen nichts Neues 768.2.4 Mchtigkeit II: Perlentaucher . . . . . . 77

8.3 Die Praxis 818.3.1 Programme und Bibliotheken . . . . . . 818.3.2 Syntax-Varianten . . . . . . . . . . . . . 818.3.3 Referenz: Regulre Ausdrcke in posix 82


9 Nerode-Klassen9.1 Nerode-Klassen 869.1.1 Die Idee . . . . . . . . . . . . . . . . . 869.1.2 Die Definitionen . . . . . . . . . . . . . 889.1.3 Der Satz von Myhill-Nerode . . . . . . 88

9.2 Anwendungen 909.2.1 Minimierung von Automaten . . . . . . 909.2.2 Nachweis der Nichtregularitt . . . . . . 90


10 Kontextfreie Grammatiken10.1 Einfhrung 9310.1.1 Grammatiken fr verschachtelte Sprachen 9310.1.2 Praxisbeispiele . . . . . . . . . . . . . . 94

10.2 Normalformen 9510.2.1 quivalenz von Grammatiken . . . . . . 9510.2.2 Vorspiel: Regulre Normalform . . . . . 9510.2.3 Chomsky-Normalform . . . . . . . . . . 96

10.3 Grenzen kontextfreier Sprachen 9910.3.1 Der Satz und sein Beweis . . . . . . . . 10010.3.2 Die Charakterisierungen im berblick . 101


Inhaltsverzeichnis v

11 Analyse kontextfreierSprachen

11.1 Der CYK-Algorithmus 10411.1.1 Die Idee . . . . . . . . . . . . . . . . . 10411.1.2 Der Algorithmus . . . . . . . . . . . . . 105

11.2 Kellerautomaten 10711.2.1 Syntax . . . . . . . . . . . . . . . . . . 10711.2.2 Semantik . . . . . . . . . . . . . . . . . 10811.2.3 Mchtigkeit . . . . . . . . . . . . . . . 10911.2.4 Deterministisch kontextfreie Sprachen . 110

Teil IIIWas ist berechenbar?

12 Maschinen I:Die Turingmaschine

12.1 Einleitung 11412.1.1 Was bedeutet berechenbar? . . . . . . 11412.1.2 Historischer Rckblick . . . . . . . . . 114

12.2 Die Turing-Maschine 11512.2.1 Turings Ideen . . . . . . . . . . . . . . 11512.2.2 Syntax . . . . . . . . . . . . . . . . . . 11612.2.3 Semantik . . . . . . . . . . . . . . . . . 11812.2.4 Korrektheitsbeweise . . . . . . . . . . . 119

12.3 Sprachklassen 12012.3.1 Aufzhlbare Sprachen . . . . . . . . . . 12012.3.2 Entscheidbare Sprachen . . . . . . . . . 120


13 Maschinen II:Nichtdeterminismus

13.1 Nichtdeterministische Turing-Maschinen 12413.1.1 Idee . . . . . . . . . . . . . . . . . . . 12413.1.2 Syntax . . . . . . . . . . . . . . . . . . 12413.1.3 Semantik . . . . . . . . . . . . . . . . . 12513.1.4 Beispiele . . . . . . . . . . . . . . . . . 12613.1.5 Nichtdeterministisches Raten . . . . . . 127

13.2 Umwandlung in deterministischeMaschinen 128

13.2.1 Die Idee . . . . . . . . . . . . . . . . . 12813.2.2 Der Satz . . . . . . . . . . . . . . . . . 128


14 Maschinen III:Register-Maschinen

14.1 Das RAM-Modell 13214.1.1 Reale Computer versus die

Turing-Maschine . . . . . . . . . . . . . 13214.1.2 Die Ideen . . . . . . . . . . . . . . . . 13214.1.3 Syntax . . . . . . . . . . . . . . . . . . 13414.1.4 Semantik . . . . . . . . . . . . . . . . . 135

14.2 Verhltnis von Zahlen und Worten 13714.2.1 Worte als Eingabe fr rams . . . . . . 13714.2.2 Funktionsberechnungen bei

Turing-Maschinen . . . . . . . . . . . . 13814.2.3 Zahlen als Eingaben fr

Turing-Maschinen . . . . . . . . . . . . 139

14.3 quivalenzsatz 13914.3.1 Die Ideen . . . . . . . . . . . . . . . . 13914.3.2 Der Satz . . . . . . . . . . . . . . . . . 139


15 Programme I: LOOP- undWHILE-Programme

15.1 Maschinen versus Programmiersprachen 146

15.2 Zwei Programmiersprachen 14615.2.1 Syntax von Loop . . . . . . . . . . . . 14615.2.2 Syntax von While . . . . . . . . . . . . 14915.2.3 Semantik von Loop . . . . . . . . . . . 14915.2.4 Semantik von While . . . . . . . . . . . 15115.2.5 Syntactic Sugar . . . . . . . . . . . . . 152

15.3 quivalenzsatz 153


16 Programme II: Rekursion16.1 Imperative versus funktionale

Programmierung 156

16.2 Primitive Rekursion 15716.2.1 Die Idee . . . . . . . . . . . . . . . . . 15716.2.2 Syntax von PrimitiveML . . . . . . . . 15716.2.3 Semantik von PrimitiveML . . . . . . . 16016.2.4 Primitivrekursiv = Loop-berechenbar . . 161

vi Inhaltsverzeichnis

16.3 -Rekursion 16516.3.1 Syntax von MML . . . . . . . . . . . 16516.3.2 Semantik von MML . . . . . . . . . . 16516.3.3 Partiell-rekursiv = While-berechenbar . 166

16.4 *Die kleenesche Normalform 167

17 Die Church-Turing-These17.1 Die Church-Turing-These 16917.1.1 Die Ackermann-Funktion . . . . . . . . 16917.1.2 Geschichte . . . . . . . . . . . . . . . . 17117.1.3 Die These . . . . . . . . . . . . . . . . 171

17.2 Alternative Modelle 17217.2.1 Grammatiken . . . . . . . . . . . . . . 17217.2.2 Game of Life . . . . . . . . . . . . . . 173

18 Unentscheidbarkeit I:Das Halteproblem

18.1 Das Halteproblem. . . 17718.1.1 Halten diese Programme an? . . . . . . 17718.1.2 Kodierung von Maschinen . . . . . . . 17818.1.3 Das formale Problem . . . . . . . . . . 179

18.2 . . . ist akzeptierbar . . . 17918.2.1 Universelle Maschine = Interpreter . . . 18018.2.2 Akzeptierbarkeit des Halteproblems . . 18118.2.3 Universelle Programme . . . . . . . . . 182

18.3 . . . aber nicht entscheidbar 18318.3.1 Diagonalisierung . . . . . . . . . . . . . 18318.3.2 Unentscheidbarkeit des Halteproblems . 184


19 Unentscheidbarkeit II:Satz von Rice

19.1 Der Rekursionssatz 18819.1.1 Zur Einstimmung . . . . . . . . . . . . 18819.1.2 Der Rekursionssatz . . . . . . . . . . . 18919.1.3 Beispiele . . . . . . . . . . . . . . . . . 19019.1.4 Der Beweis . . . . . . . . . . . . . . . 19019.1.5 Folgerung: Der Fixpunktsatz . . . . . . 192

19.2 Der Satz von Rice 19219.2.1 Indexmengen . . . . . . . . . . . . . . . 19319.2.2 Der Satz und sein Beweis . . . . . . . . 193


20 Unentscheidbarkeit III:Unentscheidbare Probleme

20.1 Nichtberechenbares 19720.1.1 Das Postsche Korrespondenzproblem . . 19720.1.2 Das Busy-Beaver-Problem . . . . . . . 19820.1.3 Kolmogorov-Komplexitt . . . . . . . . 200

20.2 Nichtberechenbareres 202


Teil IVWie schwer sind Probleme?

21 Die O-Notation21.1 Einleitung 20721.1.1 Welches Verfahren ist schneller? . . . . 20721.1.2 Laufzeitmessung . . . . . . . . . . . . . 208

21.2 O-Klassen und ihre Verwandten 20821.2.1 O-Klassen . . . . . . . . . . . . . . . . 20821.2.2 -Klassen . . . . . . . . . . . . . . . . 21021.2.3 -Klassen . . . . . . . . . . . . . . . . 21021.2.4 o-Klassen . . . . . . . . . . . . . . . . 21121.2.5 -Klassen . . . . . . . . . . . . . . . . 211

21.3 Wichtige Laufzeiten 21221.3.1 Logarithmische Laufzeit . . . . . . . . 21221.3.2 Polynomielle Laufzeiten . . . . . . . . . 21321.3.3 Exponentielle Laufzeiten . . . . . . . . 213


22 Einfhrung zurKomplexittstheorie

22.1 Ziele der Komplexittstheorie 21622.1.1 Messen der Komplexitt . . . . . . . . 21622.1.2 Klassifizieren der Komplexitt . . . . . 21622.1.3 Neue algorithmische Methoden finden . 217

Inhaltsverzeichnis vii

22.2 Zeitkomplexitt 21722.2.1 Definition . . . . . . . . . . . . . . . . 21722.2.2 Klassen . . . . . . . . . . . . . . . . . . 21822.2.3 Beispiele . . . . . . . . . . . . . . . . . 219

22.3 Platzkomplexitt 21922.3.1 Definition . . . . . . . . . . . . . . . . 21922.3.2 Klassen . . . . . . . . . . . . . . . . . . 22122.3.3 Beispiele . . . . . . . . . . . . . . . . . 221


23 Die Idee der Reduktion23.1 Einfhrung zu Reduktionen 22523.1.1 Kulinarische Vorbemerkungen . . . . . 22523.1.2 Die Idee der Reduktion . . . . . . . . . 22623.1.3 Beispiele von Reduktionen . . . . . . . 228

23.2 Die Logspace-Many-One-Reduktion 22923.2.1 Logspace-Maschinen . . . . . . . . . . 22923.2.2 Definition der

Logspace-Many-One-Reduktion . . . . 23123.2.3 Beispiele von

Logspace-Many-One-Reduktionen . . . 23123.2.4 Transitivitt . . . . . . . . . . . . . . . 233


24 Die Idee der Vollstndigkeit24.1 Klassenhierarchien 23724.1.1 Inklusionen . . . . . . . . . . . . . . . 23724.1.2 Trennungen . . . . . . . . . . . . . . . 23724.1.3 bersicht der Klassenhierarchie . . . . 238

24.2 Schwere und Vollstndigkeit 23924.2.1 Die Ideen . . . . . . . . . . . . . . . . 23924.2.2 Definition: Schwere Probleme . . . . . 23924.2.3 Definition: Vollstndige Probleme . . . 24124.2.4 Vollstndigkeit und Klassenhierarchien . 242

25 NL-Vollstndigkeit25.1 Die Klasse NL 24525.1.1 Wiederholung: ntms . . . . . . . . . . . 24525.1.2 Ressourceverbrauch von ntms . . . . . 24625.1.3 Definition der Klasse . . . . . . . . . . 246

25.2 NL-Vollstndigkeit 24725.2.1 Erreichbarkeitsprobleme . . . . . . . . . 24725.2.2 Beweisverfahren I: Bootstrapping . . . . 24925.2.3 Beweisverfahren II: Reduktionsmethode 25125.2.4 bersicht der Klassenhierarchie . . . . 252

26 P-Vollstndigkeit26.1 Einleitung 25426.1.1 P-Vollstndigkeit = gerade so lsbar . . 25426.1.2 Schaltkreise . . . . . . . . . . . . . . . 254

26.2 P-Vollstndigkeit 25526.2.1 Definition: CVP . . . . . . . . . . . . . 25526.2.2 Satz: CVP ist P-vollstndig . . . . . . . 25626.2.3 bersicht der Klassenhierarchie . . . . 259

27 NP-Vollstndigkeit27.1 Die Klasse NP 26127.1.1 Ressourceverbrauch von ntms . . . . . 26127.1.2 Definition der Klasse NP . . . . . . . . 26127.1.3 Beispiele von Sprachen in NP . . . . . 261

27.2 NP-Vollstndigkeit 26427.2.1 Erfllbarkeitsprobleme . . . . . . . . . 26427.2.2 Bootstrapping fr ein erstes Problem . . 26527.2.3 Der Satz von Cook . . . . . . . . . . . 26627.2.4 bersicht der Klassenhierarchie . . . . 268

28 Das P-NP-Problem28.1 Die Welt der NP-vollstndigen Probleme 27028.1.1 Eine andere Sicht auf NP . . . . . . . . 27028.1.2 Wichtige NP-vollstndige Probleme . . 272

28.2 Das P-NP-Problem 27428.2.1 Das Problem . . . . . . . . . . . . . . . 27428.2.2 Warum man glaubt, dass P ungleich NP

ist . . . . . . . . . . . . . . . . . . . . 27428.2.3 Warum das Problem schwer ist . . . . . 274

28.3 bersicht der Klassenhierarchie 275

AnhangLsungen zu den bungen . . . . . . . . . . . . 276Referenz: Beweisrezepte . . . . . . . . . . . . . . 280

viii Inhaltsverzeichnis

Vorwort 1

VorwortIn der Theoretischen Informatik geht es darum, sich nicht um a20-Gates kmmern zumssen. Falls Sie das a20-Gate nicht kennen, so kann man dies zu einem nicht unerheb-lichen Teil als Erfolg der Theoretischen Informatik werten:Die Geschichte des a20-Gates beginnt mit dem berhmten Ausspruch von Bill Gates(Microsoft-Begrnder und einer der reichsten Menschen der Welt): Man wird nie mehrals 640kB Hauptspeicher bentigen. berraschenderweise bentigte man dann doch mehrHauptspeicher. Daraufhin entwarf Intel den 80286 Prozessor, den Nachfolger des 8086,der sehr zukunftsorientiert bis zu 16MB ansprechen konnte. Dabei entstanden aber einProblem: Der 8086 Prozessor konnte ja nur ein Megabyte ansprechen, aber aufgrund eineretwas abenteuerlichen Speicheradressierung es war mglich, Adressen zwischen 1MB und1MB plus 64kB anzusprechen die es physikalisch gar nicht gab und deshalb auf dieersten 64kB im Speicher abgebildet wurden. Nun gab es tatschlich auch einige (obskure)Programme, die sich darauf verlassen haben und bei Adressen zwischen 1MB und 1MBplus 64kB stattdessen die ersten Stellen im Speicher erwarteten. Beim 80286 konnte manaber so nicht mehr weitermachen schlielich war jetzt ja physikalisch bis zu 16MBmglich. Gelst wurde da Problem auf eine originelle Art: Mittels des so genanntena20-Gate konnte man das System anweisen, temporr die zwanzigste Adressleitungeinfach fest auf 0 zu setzen und damit diesen wenigen Uraltprogrammen einen berlaufvorzugaukeln. Noch origineller war der Umstand, das Management des a20-Gates demTastatur-Controller zu berlassen weil hier gerade noch Platz war. Da natrlich auch16MB nicht ausreichten, folgte dem 80286 der 80386, der die 32-Bit-ra einlutete.Er brachte ein vllig neues (und viel besseres) Speichermanagement mit, erlaubte aberauch noch den klassischen so genannten real mode, in dem der 80286 emuliert wurde,der wiederum das a20-Gate bentigte. Es folgte des 80486 und dann der 80586, der aberPentium getauft wurde, da Intel damit scheiterte, sich die Zahl 80586 als Handelsmarke zuschtzen. Den groen Wurf wollte Intel dann mit der radikal neuen Itanium-Architekturschaffen um aber alte Software weiter laufen zu lassen spendierte Intel auf diesenProzessoren in einer Ecke auf etwa 1mm2 noch einen kompletten Pentium-Emulator selbstverstndlich inklusive a20-Gate.Moderne Prozessoren, aber auch Betriebssysteme und selbst moderne Programmierspra-chen, sind voll von Wunderlichkeiten wie dem a20-Gate. Die Komplexitt eines modernenProzessors oder eines modernen Betriebssystems komplett zu verstehen ist praktisch nichtmehr mglich. Das macht es auch unmglich verlssliche Aussagen darber zu machen,was ein konkretes System kann und nicht kann. Vor 20 Jahren konnte man noch imHandbuch nachschauen, wie viele Taktzyklen ein bestimmter Befehl genau dauern wird im Zeitalter hyperskalarer Pipelines mit Translation-Lookaside-Buffern ein hoffnungslosesUnterfangen.In der Theoretischen Informatik geht es darum, sich von allem Ballast zu befreien undsich auf den Kern dessen zu konzentrieren, was einen Computer wirklich ausmacht. Des-halb werden in der Theoretischen Informatik abstrakte und mathematische Modelle vonComputern untersucht und nicht konkrete Computer. Aus diesem Grund wird die Theore-tische Informatik hufig als wenig praktisch wahrgenommen ein Vorwurf, der etwasins Leere luft, da das ja gerade das Ziel ist.Es gibt sehr viele unterschiedliche Dinge betreffend einen Computer, die man abstrakt undmathematisch untersuchen kann. Uns wird in dieser Vorlesung zentral interessieren, wieComputer ganz allgemein gesprochen rechnen. In dieser Vorlesung wird es um folgendedrei zentrale Fragen gehen:

1. Wie analysiert man Syntax?Betrachten Sie bitte folgenden Programmtext:

2 Vorwort

int foo(int[] a ) {int u = a[0]; for (int i = 0; i u) u = a[i]; return u;}

Sie haben den Programmtext nicht sofort verstanden? Dann geht es Ihnen wie einemComputer. Wir rcken Programmtexte gerne ein, um sie fr Menschen besser lesbarzu machen; aus Sicht des Computers sehen sie eher wie obiger aus. Genaugenommenist die Situation sogar noch schlimmer, aus Sicht des Computers hnelt der Text ehergyptischen Hieroglyphen, schlielich versteht der Computer die Text erstmal nicht.Der erste Schritt auf dem Weg zu einer Berechnung geht deshalb ber die Syntax.Wir mssen den Computer in die Lage versetzen, Programmtext berhaupt zu analy-sieren, man spricht auch vom Parsen. Genau dieselben Ideen werden benutzt, um einehtml-Seite zu parsen oder auch um Benutzer-Eingaben zu validieren. Im ersten Teilder Vorlesung wird untersucht werden, was sich ganz allgemein ber dieses Parsenaussagen lsst. Insbesondere wird uns interessieren, was prinzipiell mglich ist undwas eher nicht.

2. Was ist berechenbar?Wer ein wenig Erfahrung mit Programmieren hat, wird besttigen knnen, dass sicheigentlich jedes Problem mit einem Computer lsen lsst es ist alles nur eine Fragedes Programmieraufwands und der Rechenzeit. Beispielsweise ist die Simulation desWeltklimas im Computer ber die nchsten hundert Jahre derzeit noch nicht exaktmglich aber nicht etwa, weil man niemand wsste wie man Algorithmen fr dieLsung der Weltklima-Differentialgleichungen programmiert; das Problem ist einfach,dass unsere Rechner nicht fett genug sind. Ebenso ist die Graphik in Computerspielederzeit eben doch nicht photorealistisch, aber wieder nicht, weil man nicht wsste,wie ein Radiocity-Render zu programmieren wre, sondern weil die Graphikkartennicht schnell genug sind.Es gibt aber recht praktische Probleme, die sich prinzipiell nicht mit Computern lsenlassen. Das liegt nicht etwa daran, dass die Probleme zu unprzise wren oder dassman phantastisch viel Zeit bruchte, sondern daran, dass es prinzipiell nicht geht.

3. Wie schwierig sind Probleme?Im letzten Teil der Vorlesung geht es um die Frage, wie effizient bestimmte Problemelsbar sind. Klar ist, dass manche Problem leichter sind als andere (das Suchen ineiner sortierten Liste ist sicherlich einfacher als das Lsen eines komplexen Diffe-rentialgleichungssystems). Man kann diese Intuition auch wieder exakter fassen, wasuns in das Gebiet der Komplexittstheorie fhrt.Quintessenz der Komplexittstheorie fr den Hausgebrauch ist, dass man Probleme,die NP-schwer sind, nicht effizient exakt lsen kann und dass man fr diese Problemehufig auf Heuristiken ausweichen muss. Ob ein Problem NP-schwer ist, sieht manentweder durch scharfes Hinschauen oder man schaut in einer Tabelle nach.

Nach diesem berblick ber die Inhalte der Veranstaltung wird es hchste Zeit, sich denZielen zu widmen. Jedes Kapitel dieses Skripts entspricht in der Regel einer Vorlesungs-doppelstunde und mit jedem Kapitel verfolge ich gewisse Ziele, welche Sie am Anfangdes jeweiligen Kapitels genannt finden. Neben diesen etwas kleinteiligen Zielen gibt esauch folgende zentralen Veranstaltungsziele, zitiert aus dem Modulhandbuch:

1. Theoretische Grundlagen der Syntax und der operationalen Semantik von Program-miersprachen kennen

2. Mglichkeiten und Grenzen der Informatik verstehen3. Algorithmische Probleme modellieren und mit geeigneten Werkzeugen lsen knnen4. Algorithmische Probleme nach ihrer Komplexitt klassifizieren knnen

Das Wrtchen knnen taucht bei den Veranstaltungszielen recht hufig auf. Um etwaswirklich zu knnen, reicht es nicht, davon gehrt zu haben oder davon gelesen zu ha-ben. Man muss es auch wirklich getan haben: Sie knnen sich tausend Fuballspiele imFernsehen anschauen, sie sind deshalb noch kein guter Fuballspieler; sie knnen tausendStunden World of Warcraft spielen, sie werden deshalb trotzdem keinen Frostblitz aufIhren Professor geschleudert bekommen.

Deshalb steht bei dieser Veranstaltung der bungsbetrieb mindestens gleichberechtigtneben der Vorlesung. Der Ablauf ist dabei folgender: In der Vorlesung werde ich Ihnen die

Vorwort 3

Thematik vorstellen und Sie knnen schon mit dem ben im Rahmen kleiner Minibungenwhrend der Vorlesung beginnen. Jede Woche gibt es ein bungsblatt, das inhaltlich zuden Vorlesung gehrt. Sie mssen sich die bungsbltter aber nicht alleine erkmpfen.Vielmehr gibt es Tutorien, in denen Sie Aufgaben ben werden, die so hnlich wie dieAufgaben auf den bungsblttern sind. Sie werden feststellen, dass die als leicht und inder Regel auch die als mittel eingestuften Aufgaben mit der Vorbereitung im Tutoriumin der Tat mit vertretbarem Aufwand schaffbar sind. Ist eine Aufgabe schwer, so ist eskein Unglck, wenn Sie diese nicht schaffen probieren sollten Sie es aber trotzdem.

Ich wnsche Ihnen viel Spa mit dieser Veranstaltung.

Till Tantau

4 Teil ISyntaxbeschreibung

Teil ISyntaxbeschreibung

Auch wenn die Bezeichnung Computer suggeriert, dass Computer zum Rechnen gedachtseinen, ist die Syntaxanalyse eine ihrer Hauptbeschftigungen. Ununterbrochen mssenComputer Texte lesen und verstehen, beispielsweise beim

Abarbeiten eines Skriptes, beginnend mit dem Boot-Skript, Einlesen des Quelltextes einer Webseite, Ausfhren des lua-Skripts in einem Computerspiel, bersetzen eines Programms, Lesen einer Konfigurationsdatei, ffnen und Speichern von Dokumenten, berprfung von Nutzereingaben, . . .

Die Liste liee sich endlos fortsetzen. Bevor wir uns im nchsten Teil dieser Veranstal-tung der Frage widmen, wie diese Syntaxanalyse algorithmisch funktioniert, mssen wirzunchst ein wenig Ordnung in die Sache bringen.

Man wre schlecht beraten, wenn man fr jede der obigen Aufgaben das Rad der Syn-taxbeschreibung und -analyse neu erfinden wrde. Vielmehr ist es wnschenswert, dieimmer gleichen Syntaxprobleme einheitlich zu beschreiben, damit man sie spter aucheinheitlich lsen kann. Genau darum geht es in diesem ersten Teil: Wie beschreibt manSyntax mglichst einheitlich?

1 Alphabet, Wort, Sprache 5

1-1 1-1

Kapitel 1Alphabet, Wort, SpracheEine einheitliche Sicht auf die Problem dieser Welt

1-2 1-2Lernziele dieses Kapitels

1. Mathematische Objekte als Worte kodieren knnen2. Entscheidungsprobleme als Sprachen formalisieren

knnen3. Grundoperationen auf Sprachen anwenden knnen

Inhalte dieses Kapitels1.1 Zur Einstimmung 6

1.2 Wie formalisiert man Probleme? 71.2.1 Probleminstanzen sind Worte . . . . . . 71.2.2 Operationen auf Worten . . . . . . . . . 91.2.3 Probleme sind Sprachen . . . . . . . . . 101.2.4 Operationen auf Sprachen . . . . . . . . 12


Worumes heutegeht

Worumes heutegeht

Jeder, der schon einmal versucht hat, einen ssh-Tunnel korrekt zu konfigurieren oderdas Lschen aus einem avl-Baum in C zu implementieren, wird folgender empirischenBeobachtung uneingeschrnkt zustimmen: Computer sind dafr da, Probleme zu lsen,die man ohne sie nicht htte. In diesem Kapitel geht es darum, Probleme formal zufassen, um sie einer formalen Analyse (sprich: mathematischen) zugnglich zu machen unabhngig davon, ob wir das Problem nun auch ohne Computer htten oder nicht.

Es hat sich herausgestellt, dass sich der Begriff der formalen Sprache besonders gut eignet,um Probleme in ganz allgemeiner und trotzdem einfacher Art zu beschreiben. Historischkommt der Begriff aus der Linguistik (wenig berraschend) und bei Sprache denktman im Allgemeinen eher nicht an Probleme (bei Fremdsprache hingegen schoneher). Lassen Sie sich von dem Begriff nicht irritieren: Immer wenn in diesem Skript vonSprache die Rede ist, knnte genausogut Problem oder Problemstellung stehen in der Theorie ist es aber einfach blich, von Sprachen zu sprechen. In der Datenbank-Theorie heien Sprachen brigens Boolean queries, was auch nicht wirklich besser ist.

6 1 Alphabet, Wort, Sprache1.2 Zur Einstimmung

1.1 Zur Einstimmung

1-4 1-4Welche Informatik-Probleme umranken einen Programmtext?Ein zentraler Bestandteil der Informatik ist die Untersuchung von Programmtexten wiedem folgenden:

for (int i = 1; i < 1000000000; i++) {

int n = i;

while (n != 1)

if (n % 2 == 0) n = n / 2;

else n = 3*n + 1;

}

Es gibt viele Aspekte/Fragestellungen/Probleme, die man bei diesem Programmtext un-tersuchen kann:

Ist das Programm syntaktisch korrekt? Was macht das Programm?

Zur Diskussion Welche weiteren Fragestellungen fallen Ihnen ein?

1-5 1-5Was ist eine Fragestellung oder ein Problem im Informatik-Kontextallgemein?

Das Wort Problem ist eine nicht ganz glckliche bersetzung des englischen pro-blem. Exakter, aber auch nicht viel besser, wren Aufgabe, Aufgabenstellungoder Problemstellung.

Generell geht es darum, zu vielen unterschiedlichen so genannten Probleminstanzen,kurz Instanzen, jeweils eine Lsung zu finden.

Unterscheiden kann man Probleme zunchst grob danach, welche Art von Probleminstan-zen und Lsungen mglich sind.Mgliche Probleminstanzen Zahlen und Zahlentupel Formeln Graphen Texte . . .

Mgliche Lsungen Ja/Nein Zahlen und Zahlentupel Texte Belegungen . . .

1-6 1-6Instanz- und Lsungsarten einiger Informatik-Probleme.Beispiel: Das Sortier-ProblemInstanzen Tupel von ZahlenLsungen Tupel von Zahlen

Beispiel: Das Primzahl-ProblemInstanzen ZahlenLsungen Ja/Nein

Beispiel: Das E-Mail-Adressen-ProblemInstanzen TexteLsungen Ja/Nein

1 Alphabet, Wort, Sprache1.2 Wie formalisiert man Probleme? 7

1.2 Wie formalisiert man Probleme?

1-7 1-7Auf dem Weg zum formalen Problem.

Es gibt sehr viele mgliche Arten von Instanzen und Lsungen. In der Theoretischen Informatik mchten wir mglichst allgemeine Aussagen machen es wre unschn, wenn wir jeden Satz fr jede Art von Instanzen neu beweisenmssten.

Fr die Theorie brauchen deshalb eine mglichst einfache Art von Instanzen, mit dersich trotzdem alle Probleme beschreiben lassen.

1.2.1 Probleminstanzen sind Worte

1-8 1-8Wie kodiert man Probleminstanzen?

Es gibt viele Arten von Probleminstanzen: Zahlen, Tupel, Texte, Graphen, Matrizen,etc.

Wie schon Alan Turing feststellte, mssen aber all diese Probleminstanzen letztendlichirgendwie aufgeschrieben werden.

Es liegt folglich nahe, nur noch Texte als Probleminstanzen zuzulassen alles anderemuss dann eben als Text aufgeschrieben werden.

Beispiel: Zahlen als Texte

Aus der Zahl eine Million wird die Zeichenfolge 1000000. Aus der Zahl drei Halbe wird die Zeichenfolge 1.5.

Zur DiskussionMachen Sie Vorschlge, wie man die Zahlen ein Drittel, Wurzel aus Zwei und Pi

kodieren knnte.

Beispiel: Zahlentupel als Texte

Aus dem Paar (3,2) wird die Zeichenfolge (3,2) oder alternativ 3#2. Aus dem Tupel (1,100,0,0) wird die Zeichenfolge (1,100,0,0) oder alternativ1#100#0#0.

Beispiel: Graphen als TexteAus dem Graphen

A B

C D

wird

8 1 Alphabet, Wort, Sprache1.2 Wie formalisiert man Probleme?

1-9 1-9Die Formalisierung von Worten II Definition: Alphabet

Ein Alphabet ist eine nichtleere endliche Menge. Die Elemente eines Alphabets heienSymbole.

Zum Aufschreiben von Alphabeten benutzt man in der Regel lateinische Grobuch-staben wie A, N oder T oder griechische wie oder .

Beispiele von wichtigen Alphabeten sind das binre Alphabet {0,1}, das genetischeAlphabet {a,c,g,t}, das Dezimalalphabet {0,1,2, . . . ,9}, der ascii-Code oder derunicode.

Auch das Leerzeichen oder Blanksymbol ist ein mgliches Symbol, beschrieben oder auch manchmal .

1-10 1-10Alphabete in der PraxisAlphabete in XML Die Strukturierungssprache xml wird weltweit eingesetzt und es gibt viele Alpha-bete auf der Welt.

Der xml-Standard erlaubt es uns deshalb anzugeben, welches Alphabet wir nutzenwollen.

Das verwendete Alphabet heit allerdings Encoding. In folgendem Beispiel ist dasAlphabet gerade gleich unicode.

150g Mehl

1/8l Milch

3 Eier (getrennt)

Puderzucker und eine Prise Salz

1-11 1-11Die Formalisierung von Worten III Definition: Worte

Ein Wort ber einem Alphabet ist eine endliche Folge von Symbolen aus dem Al-phabet.

Das i-te Symbol eines Wortes w bezeichnen wir mit w[i]. Die leere Folge bezeichnen wir mit .

Bemerkungen: Andere Bezeichnungen fr Worte sind Zeichenkette oder String. Zweidimensionaler Text lsst sich auch leicht als Wort darstellen, wenn ein spe-zielles Zeilenumbruchzeichen benutzt wird. (Leider sind sich Windows und Unixnicht einig, welches dies sein sollte. . . )

Das Wort , das nur aus einem Blanksymbol besteht, hat die Lnge 1. Das Wort hat hingegen die Lnge 0.

1-12 1-12Worte in der PraxisWorte in XML Ein komplettes xml-Dokument ist ein einziges Wort. Der folgende Programmtext hat als Wort 226 Zeichen, inklusive 6 Zeilenendezei-chen:

150g Mehl

1/8l Milch

3 Eier (getrennt)

Puderzucker und eine Prise Salz


1-13 1-13Mengen von Worten bestimmter LngenDie Lnge eines Wortes ist von zentraler Bedeutung in der Theorie: Je Lnger ein Wort,desto mehr Ressourcen werden in der Regel fr seine Verarbeitung bentigt.

I Definition: Lnge eines WortesDie Lnge eines Wortes w bezeichnen wir mit |w|.

I Definition: Mengen von Worten bestimmter LngeSei ein Alphabet und n N. Wir benutzen folgende Notationen:

Notation Bedeutung Menge aller Worte ber n Menge der Worte in der Lnge nn Menge der Worte in der Lnge hchstens nn Menge der Worte in der Lnge mindestens n

1-14 1-14Von der Zahl zum Wort und zurckWir haben schon gesehen, dass man Zahlen sehr einfach als Worte ber dem Alphabet{0,1,2, . . . ,9} ausdrcken kann. Es geht aber auch umgekehrt:

I Definition: Worte als Zahlen

Sei ein Alphabet mit maximal neun Zeichen. Dann knnen wir mittels einer injektiven Funktion : {1, . . . ,9} die Zeichendurchnummerieren.

Jetzt kann man jedes Wort w ber dem Alphabet leicht als Zahl darstellen: Ausabacba wird

a b a c b a

1 2 1 3 2 1

= 121321

Die Abbildung von Wort zu Zahl kann man auch schreiben als Injektion : Nmittels (w) =

|w|1i=0 (w[|w| i]) 10i.

1-15 1-15Worte oder Zahlen?

Man kann sich aussuchen, ob man lieber Worte oder lieber Zahlen zur Kodierungvon Instanzen benutzen wollen.

Die Anfnge der Theorie in den 20er und 30er Jahren des letzten Jahrhunderts gingenvon Mathematikern und insbesondere Logikern aus, die lieber mit Zahlen gearbeitethaben.Zahlen sind natrlich auch fr das Rechnen passender.

Worte sind hingegen viel praktischer, wenn Instanzen eine interne Struktur haben. Im Folgenden werden in aller Regel nur Worte benutzt, um Instanzen zu kodieren.

1.2.2 Operationen auf Worten

1-16 1-16Was man alles mit Worten anstellen kannUm mit Worten zu arbeiten, muss man sie manipulieren knnen. Hier gibt es viele Mg-lichkeiten:

I Definition: Verkettung von WortenSeien u,v zwei Worte ber dem Alphabet . Dann bezeichnet u v die Verkettungvon u und v (einfach u und v hintereinander geschrieben). Den Kringel lsst man hufigauch einfach weg.

Verkettet man w mit dem leeren Wort, so erhlt man wieder w. (Fr Profis: (,) bildetein Monoid mit dem leeren Wort als neutralem Element. Das Monoid ist kommutativgenau dann, wenn ||= 1.)


I Definition: Potenzieren von WortenSei w . Dann ist w2 = ww, das Quadrat von w, einfach w zweimal hintereinandergeschrieben. Entsprechend ist wn einfach w genau n-mal hintereinander geschrieben.Man definiert w1 = w und w0 = .

I Definition: Umdrehen von WortenSei w. Dann bezeichnen sowohl wrev wie auch w1 das Wort w rckwrts geschrieben(reversed).

I Definition: Ersetzung von BuchstabenSeien und zwei Alphabete. Eine Ersetzung ist eine Abbildung h : . Sie gibtan, wie Buchstaben aus dem ersten Alphabet durch Worte aus dem zweiten Alphabet zuersetzen sind.Eine Ersetzung h lsst sich zu einem Homomorphismus h : fortsetzen, indemman definiert h(w) := h(w[1])h(w[2]) h(w[|w|]).Man ersetzt also einfach buchstabenweise die Symbole des Wortes.

Beachte: Mengenoperationen wie Schnitt oder Vereinigung ergeben keinen Sinn fr Worte.Worte sind keine Mengen.

1-17 1-17Homomorphismen in der PraxisHomomorphismen werden in der Praxis stndig gebraucht, sie heien dort aber Umkodie-rungen:

Wandelt man einen ascii-kodierten Text in unicode-kodierten Text um, benutzt mandazu eine ganz einfache Ersetzung h : ascii unicode, die jedem ascii-Zeichengenau das zugehrige unicode-Zeichen zuordnet.

Wandelt man unicode in ascii um, so gibt es zwei Mglichkeiten:1. Die Ersetzung bildet die meisten Zeichen des unicode auf mehr oder weniger

geeignete Zeichen des ascii ab, im Notfall auf das Nullzeichen.2. Die Ersetzung ersetzt einzelne Zeichen des unicode durch mehrere Zeichen des

ascii das passiert beispielsweise bei der utf8-Kodierung. Aus den Ersetzungen entstehen nun Homomorphismen, die ascii-Worte auf unicode-Worte abbilden oder umgekehrt.

1.2.3 Probleme sind Sprachen

1-18 1-18Entscheidungsprobleme sind SprachenZur Erinnerung:

Bei einem Entscheidungsproblem hat man viele mgliche Instanzen als Eingabe. Das Problem ist nun, fr jede Instanz eine der beiden mglichen Antworten Jaoder Nein richtig auszusuchen.

Wie formalisiert man Entscheidungsprobleme?

Wir haben schon geklrt, wie wir Instanzen formalisieren: als Worte. Es bleibt zu klren, wie wir die Zuordnung von Instanzen zu Ja oder Neinmodellieren. Hier gibt es zwei Mglichkeiten:

1. Man formalisiert die Zuordnung als eine charakteristische Funktion : {0,1}, wobei 0 fr Ja steht und 1 fr Nein.

2. Man benutzt einfach die Menge aller Ja-Instanzen.Offenbar sind beide Formalisierungen gleich mchtig, die zweite ist aber praktischer.


1-19 1-19Definition formaler Sprachen

I Definition: Formale SpracheEine formale Sprache A ber einem Alphabet ist eine beliebige Teilmenge A .

Beispiel: Das E-Mail-Adressen-ProblemSei = ascii. Dann ist email-address die Menge aller gltigen E-Mail-Adressen. So [email protected] ein Element der Sprache, hingegen tantau@@foonicht.

Beispiel: Das PalindromproblemSei ein festes Alphabet. Dann ist palindromes die Menge aller Worte in , die vorwrtswie rckwrts gleich sind.Beachte: Fr jedes Alphabet ergibt sich ein anderes Palindromproblem, man msste ei-gentlich schreiben palindromes. Das macht aber niemand.

Beispiel: Das PrimzahlproblemSei = {0,1,2, . . . ,9}. Dann ist primes die Menge {2,3,5,7,11,13, . . .} . Beachte:Diese Sprache enthlt Worte und nicht Zahlen (auch wenn es so aussieht).

Beispiel: Das Java-HalteproblemSei = unicode. Dann ist java-halting die Menge aller Worte, die den Quelltextvon Java-Programmen ohne Eingabe oder Ausgaben darstellen, die nach endlicher Zeitanhalten.

1-20 1-20Und was ist mit Funktionsproblemen?

In der Praxis sind die meisten Probleme gar keine Entscheidungsprobleme. Viel hufiger sind Funktionsprobleme, wo fr eine Eingabe eine Ausgabe berechnet

werden muss. Formal ist ein Funktionsproblem eine Funktion f : , die (Eingabe-)Worte auf(Ausgabe-)Worte abbildet.

Man kann aber jedes Funktionsproblem auf mehrere Arten in Entscheidungsproblemeumwandeln.

I Definition: Die bin-FunktionDie Funktion bin : N {0,1} bildet natrliche Zahlen auf ihre Darstellung als Binr-string ab.

Beispielsweise gilt bin(5) = 101 und bin(0) = 0.

I Definition: Sprache des Graphen und Test-SpracheSei f : eine Funktion und sei # ein Symbol, das weder in noch in vorkommt.Dann ist

1. {w# f (w) | w } die Sprache des Graphen von f .2. {w#bin(i)#c | w , i N,c , f (w)[i] = c} die Test-Sprache von f .


1.2.4 Operationen auf Sprachen

1-21 1-21Was man alles mit Sprachen anstellen kann I

Genau wie man Worte manipulieren kann, kann man auch Sprachen manipulieren. Manipuliert man eine Sprache, so erhlt man eine neue Sprache und damit auch einneues Problem.

I Definition: Grundoperationen auf SprachenGegeben seien zwei Sprachen L,M . Dann heit:

BedeutungLM Vereinigung der SprachenLM Schnitt der SprachenLrev Umdrehung der Sprache: die Menge {wrev | w L}L Komplement der Sprache L: die Menge LLM Verkettung der Sprachen: {u v | u L,v M}Ln n-te Potenz von L: Worte, die durch die Verkettung von

genau n Worten aus L entstehenL Kleene-Stern der Sprache: beliebige Worte, die durch

Verkettung von Worten aus L entstehen

Es gilt per Definition L.

1-22 1-22Schnitt und Vereinigung in der Praxis

Datums-ValidierungIn vielen Anwendungen, besonders bei Web-Anwendungen, mssen Datumseingaben derBenutzer validiert (=berprft) werden.Dieses Entscheidungsproblem lsst sich mittels mehrerer Einzeltests modularisieren:

Test, ob die Eingabe nur aus Ziffern und Punkten besteht. Test, ob es genau zwei Punkte gibt. Test, ob der Wortanfang aus der Menge {1, . . . ,31} kommen. Test, ob nach dem ersten Punkte ein Wort aus {1, . . . ,12} kommt.

Jeder Test ergibt eine Menge an Worten, die diesen Test besteht, also eine Sprache. DerSchnitt dieser Sprachen ist dann der Gesamttest.Will man noch ein alternatives Datumsformat zulassen (wie 2009-01-01), so schreibtman neue Tests, schneidet diese und vereinigt dann die beiden entstehenden Sprachen.

1-23 1-23Zur bung Sei = {0,1,2, . . . ,9} und primes = {2,3,5,7,11, . . .}.

1. Wie lautet primes? Die richtige Lsung ist nicht {0,1,4,6,8,9,10, . . .}.2. Geben Sie drei Worte an, die nicht in primes liegen.3. Geben Sie ein Wort in primes2 primes an.

1-24 1-24Der Kleene-Stern in der Praxis

Der Huffman-Code und der Kleene-Stern

Der Huffman-Code ist eine Methode, Daten zu komprimieren. Daten werden ber dem Kodierungsalphabet = {0,1} kodiert. Zu einem Eingabealphabet wird eine (endliche) Sprache L von Codes gebaut.

Beispiel: Ist das Eingabealphabet = {a,b,c,d,e}, so knnte L = {10,11,001,01,000} sein.

Worte aus L enthalten dann gerade hintereinander geschriebene Codes. Beispiel:1011001 = 1011001 L.

Folglich sind die Worte in L gerade die in einer Huffman-Kodierung verwendetenkomprimierten Worte.

1 Alphabet, Wort, SpracheZusammenfassung dieses Kapitels 13

1-25 1-25Was man alles mit Sprachen anstellen kann II

I Definition: Bild einer SpracheSei h : eine Funktion (beispielsweise ein Homomorphismus), L und M.Dann bezeichnen

h(L) = {h(w) | w L} das Bild von L unter h und h1(M) = {w | h(w) M} das Urbild von M unter h.

1-26 1-26Bilder und Urbilder in der Praxis

Der Huffman-Code und Bilder und Urbilder

Der Huffman-Code bildet Eingabesymbole auf Codeworte mittels einer Ersetzung ab.Beispiel: Ist das Eingabealphabet = {a,b,c,d,e}, so knnte h(a) = 10, h(b) = 11,h(c) = 001, h(d) = 01 und h(e) = 000 gelten.

Dann ist h() die Menge aller mglichen komprimierten Worte. Umgekehrt ist h1({w}) die Menge aller Eingabeworte, die komprimiert gerade wergeben.Beispiel: h1({1011001}) = {abc}Beispiel: h1({0000}) = {}

Der Huffman-Code ist gerade so gemacht, dass fr jedes Wort w gilt |h1(w)| 1. Jedes Wort lsst sich also eindeutig dekodieren.

Zusammenfassung dieses Kapitels

1-27 1-271. Praktisch alle in der Informatik untersuchten Probleme lassen sich als Sprachen be-schreiben.

2. Sprachen sind Mengen von Worten, die ihrerseits Folgen von Symbolen sind.3. Worte wie Sprachen lassen sich manipulieren durch Operationen.

Zum Weiterlesen[1] J. Hopcroft, R. Motwani, J. Ullman. Introduction to Automata Theory, Languages

and Computation, Addison Wesley, 2002.[2] Ch. Papadimitriou. Computational Complexity, Addison Wesley, 1994.[3] R. Reischuk. Unterlagen zum Lehrmodul Theoretische Informatik, Vorlesungsskript,

2008. Kapitel 1.1 und 1.2.[4] U. Schning. Theoretische Informatik kurzgefasst, Spektrum Akademischer Verlag,

1997.

bungen zu diesem Kapitel

bung 1.1 Kombinatorik auf Worten, leichtSei ein Alphabet der Gre s, also ||= s. Bestimmen Sie die Mchtigkeit (Anzahl der Elemente)der folgenden Mengen:1. n (Worte der Lnge genau n),2. n (Worte der Lnge hchstens n),3. nm (Worte der Lnge zwischen m und n).4. Menge der Worte der Lnge genau s, in denen jedes Zeichen genau einmal vorkommt.5. Menge der Unteralphabete mit ||= 4.6. palindromesn (Menge der Palindrome der Lnge genau n).

14 1 Alphabet, Wort, Sprachebungen zu diesem Kapitel

bung 1.2 Kombinatorik auf Worten, mittel1. Sei ein Alphabet der Gre k. Bestimmen Sie die Mchtigkeit folgender Mengen:

1.1 Menge der Strings der Lnge n, in denen kein Zeichen zwei mal vorkommt.1.2 Menge der Strings der Lnge n, in denen genau ein Zeichen fnf mal vorkommt und die

anderen Zeichen jeweils genau ein mal.2. Waren lassen sich durch so genannte Barcodes kennzeichnen. Ein Codewort ist eine Folge von

schmalen und breiten Strichen mit schmalen oder breiten Lcken dazwischen. Beantworten Siefolgende Fragen:2.1 Wie viele verschiedene Codewrter lassen sich mit n Strichen erzeugen?2.2 Wie viele Mglichkeiten sind es, wenn Codewrter, die durch Vertauschung der Lese-

richtung (rechts links) ineinander bergehen, nicht unterschieden werden?

bung 1.3 Worte als Zahlen darstellen, schwerSei ein Alphabet und : {1, . . . , ||} eine Bijektion. Sei : N definiert durch (w) =Q|w|

i=1 p(w[i])i , wobei pi die i-te Primzahl ist. Zeigen Sie, dass eine Injektion ist.

Tipps: Die Buchstaben und heien Iota und Kappa. Falls Ihnen die Begriffe Bijektionund Injektion nicht klar sind, dann klren Sie diese zunchst. Nehmen Sie sich dann ein paarBeispiele her und untersuchen Sie, was bei diesen Beispielen macht. Sie werden fr Ihren Beweisden Satz ber die eindeutige Primfaktorzerlegung bentigen.

bung 1.4 Einfache Operationen auf Sprachen, mittelSei = {a} und seien L = {a2n | n 1} und M = {a3n | n 1}, die Sprachen ber , die genau dieWrter der Lnge teilbar durch Zwei beziehungsweise Drei enthalten. Geben Sie folgende Mengenin symbolischer Mengenschreibweise an:1. LM,2. Lrev,3. L,4. L2,5. LM,6. L.

bung 1.5 Homomorphie-Eigenschaft, mittelMan sagt, eine Funktion f : hat die Homomorphie-Eigenschaft, wenn fr alle u,v giltf (uv) = f (u) f (v). Zeigen Sie, dass eine Funktion f genau dann die Homomorphie-Eigenschafthat, wenn es eine Ersetzung h : gibt mit h = f .Bemerkung: Die Aufgabe zeigt, dass man Homomorphismen auch einfach als Funktionen definierenknnte, die die Homomorphie-Eigenschaft haben.

bung 1.6 Eindeutigkeit der Huffman-Kodierung, schwerSei = {a,b,c,d,e} und = {0,1}. Sei h : definiert durch h(a) = 10, h(b) = 11, h(c) =001, h(d) = 01 und h(e) = 000. Zeigen Sie, dass |h1({w})| 1 gilt fr alle w .Tipp: Informieren Sie sich, wie der Huffman-Code funktioniert, insbesondere wie Huffman-Bumeaufgebaut sind. Zeigen Sie dann die Behauptung durch Induktion ber die Lnge von w. Fr deninduktiven Schritt zeigen Sie, dass die ersten Zeichen von w dieses eindeutig zerlegen.

bung 1.7 Funktionen berechnen mit Test-Sprachen, leichtSie mchten eine recht kniffelige Funktion f : {a, . . . ,z} {a, . . . ,z} berechnen mittels einerJava-Methode

String f (String w)

Diese soll, angewendet auf eine Zeichenkette w gerade f (w) zurckliefern. In einer Software-Bibliothek gibt es glcklicherweise bereits eine Methode

boolean test (String s)

die die Test-Sprache von f entscheidet. Implementieren Sie f unter Benutzung der Methode test.

bung 1.8 Funktionen berechnen mit der Sprache des Graphen, mittelWie in Aufgabe 1.7 soll die Funktion f implementiert werden. Diesmal steht aber in der Software-Bibliothek eine Entscheidungsmethod fr den Graph von f zur Verfgung:

boolean graph (String s)

Implementieren Sie f unter Benutzung der Methode graph.

2 Grammatiken 15

2-1 2-1

Kapitel 2GrammatikenAm Anfang war das Startsymbol


1. Begriffe der Regel und der Ableitung verstehen2. einfache Syntaxprobleme mittels Grammatiken

beschreiben knnen3. Korrektheitsbeweise fhren knnen

Inhalte dieses Kapitels2.1 Einleitung 162.1.1 Grammatiken fr natrliche Sprachen . 162.1.2 Grammatiken fr Programmiersprachen 17

2.2 Formale Grammatiken 182.2.1 Definition: Regeln . . . . . . . . . . . . 182.2.2 Definition: Ableitungen . . . . . . . . . 192.2.3 Korrektheitsbeweise . . . . . . . . . . . 21


Worumes heutegeht

Worumes heutegeht

In der Theoretischen Informatik sind Grammatiken das Vehikel, um die Syntax von allemund jedem zu beschreiben. Zur Erinnerung: die Syntax einer (Programmier)sprache be-schreibt den Aufbau von Programmen (in der Theoretischen Informatik also Worten),die sich korrekt verarbeiten lassen die Syntax sagt nichts aus ber die Bedeutung dieserWorte, ber ihre Semantik.

Es gibt mehrere Grnde, weshalb Grammatiken nicht nur in der Theorie so beliebtsind, um Syntax zu beschreiben:

1. Grammatiken erlauben es sehr einfach, den hierarchischen Aufbau der Syntax darzu-stellen. Da die meisten (Programmier)sprachen stark hierarchisch aufgebaut sind, istdies recht wichtig.

2. Grammatiken sind zwar deskriptiv (sie beschreiben nur), jedoch lassen sie sich gutautomatisch in Programme verwandeln, die Worte auf grammatikalische Korrektheitberprfen.

3. Grammatiken sind sehr mchtig: jedes mit einem Computer prinzipiell lsbare Syn-taxproblem lsst sich auch mit einer Grammatik beschreiben.

In der Praxis gibt es neben Grammatiken noch ein weiteres gngiges System zur Syn-taxbeschreibung: regulre Ausdrcke, denen spter ein eigenes Kapitel gewidmet ist. ImUnterschied zu Grammatiken sind regulre Ausdrcke weit weniger mchtig (die genaueMchtigkeit wird noch eingehend errtert werden), jedoch oft viel kompakter als Gram-matiken.

16 2 Grammatiken2.1 Einleitung

2.1 Einleitung

2-4 2-4Die Kunst des Lesens und Schreibens

Grammatiken (Die Kunst des Lesens und Schreibens) gibt es seit der Antike. Sie behandelt das Problem, den Aufbau von Texten zu beschreiben und zu analysieren.

Public domain

Allegorische Darstellung der Grammatik, ihre Disziplinen als Armeen. Aus Antoine Furetires Nouvelle Alle-gorique, Ou Histoire Des Derniers Troubles Arrivez Au Royaume DEloquence (1659).

2.1.1 Grammatiken fr natrliche Sprachen

2-5 2-5Was beschreibt eine Grammatik alles?Eine der Hauptaufgabe von Grammatik ist, den hierarchischen Aufbau von Stzen allge-mein zu beschreiben.

Beispiel: Typische Grammatikregeln im Deutschen

1. Ein Satz besteht aus einem Subjekt und einem Prdikat.2. Ein Subjekt kann ein Substantiv zusammen mit einem passenden Artikel sein.3. Jedem Substantiv knnen Adjektive vorangestellt werden.4. . . .

Grammatikregeln sagen nur etwas ber den erlaubten Aufbau aus und nichts ber denInhalt.

So ist der Satz Die Informatik blkt herzerweichend. grammatikalisch richtig, aberinhaltlich eher zweifelhaft.

MerkeGrammatiken beschreiben Syntax, nicht Semantik (=Bedeutung).

2-6 2-6Ein Beispiel, wie man Grammatikregeln anwendet.

Anwenden von Regeln (Ableiten)Subjekt Artikel Adjektivliste Substantiv Artikel Adjektivliste Reiter Der Adjektivliste Reiter Der Adjektiv Reiter Der blaue Reiter

2 Grammatiken2.2 Einleitung 17

2-7 2-7Beobachtungen

Grammatikregeln sind Ersetzungsregeln. In einem noch nicht fertigen Satz wie Der Adjektiv Student gibt es Teile, die nochersetzt werden, und Teile, die nicht mehr ersetzt werden.

Die Teile, die nicht weiter ersetzt werden, nennt man Terminale. Die Teile, die noch weiter ersetzt werden, nennt man Nonterminale.

Beachte: Ersetzungsregeln reichen nicht aus, um die gesamte Komplexitt natrlicherSprache zu beschreiben.

2.1.2 Grammatiken fr Programmiersprachen

2-8 2-8Von der antiken Grammatik zur formalen Grammatik

Genau wie natrliche Sprachen sind auch Computersprachen nach hierarchischenRegeln aufgebaut.

Tatschlich sind Computersprachen nach viel strikteren Regeln aufgebaut als natr-liche Sprache: Bekanntermaen reicht schon ein vergessenes Semikolon, um einenProgrammtext unbrauchbar zu machen.

Es liegt also nahe, Systeme zur Beschreibung von (natrlichen) Grammatiken auchauf die Beschreibung der Grammatik von Programmtexten anzuwenden.

Die wichtigsten und einfachsten Systeme sind Semi-Thue-Systeme, im Folgenden ein-fach formale Grammatiken genannt.

2-9 2-9Die Grammatik von Programmiersprachen

Bei Programmiersprachen beschreibt die Grammatik, wie Programmtexte gebildetwerden knnen.

Es gibt verschiedene Anstze, aber ein gngiger ist, Programmtexte durch Regeln zubeschreiben.

Beispiel: Typische Grammatikregeln

1. Eine Klasse kann von der Bauart sein class Bezeichner { Methodenliste }.2. Ein Bezeichner ist eine Folge von Zeichen und Buchstaben, die mit einem Buchstaben

beginnt.3. Eine Methodenliste besteht aus vielen Methoden.4. Eine Methode besteht aus einem Kopf und einem Rumpf.5. . . .

2-10 2-10Ein Beispiel, wie man Grammatikregeln anwendet.

Anwenden von Regeln (Ableiten)Klasse class Bezeichner { Methodenliste } class Love { Methodenliste } class Love { Methode } class Love { Love () {}}

2-11 2-11Beobachtungen

Wieder sind Grammatikregeln Ersetzungsregeln. Wieder gibt es Teile, die noch ersetzt werden, und Teile, die nicht mehr ersetzt werden. Die Teile, die nicht weiter ersetzt werden, nennt man wieder Terminale. Die Teile, die noch weiter ersetzt werden, nennt man wieder Nonterminale.

Beachte: Wieder reichen (einfache) Ersetzungsregeln nicht aus, um die gesamte Komple-xitt von Programmiersprachen zu beschreiben.

18 2 Grammatiken2.2 Formale Grammatiken

2.2 Formale Grammatiken2.2.1 Definition: Regeln

2-12 2-12Formale Definition von Regeln

I Definition: Formale GrammatikEine formale Grammatik G besteht aus vier Teilen:

1. Einem Terminalalphabet T .2. Einem Nonterminalalphabet N, das von Terminalalphabet disjunkt ist.3. Einem Startsymbol S N.4. Einer endlichen Menge P von (Produktions-)Regeln, jede von der Form:

l r

wobei l,r (NT ) und l mindestens ein Nonterminalsymbol enthlt.

Bemerkungen zur Definition:

Eine Formulierung wie Foo besteht aus vier Teilen bedeutet mathematisch, dassFoo ein Vier-Tupel ist.

Deshalb schreibt man oft Sei G = (T,N,S,P). . . Damit ist gemeint: Sei mal G eine beliebige Grammatik. Dann muss sie ja

(wie jede Grammatik) ein Vier-Tupel sein. Die erste Komponente nennen wireinfach mal T , die zweite N, die dritte S und die vierte P.Fr weitere Information ber die Frage, wie man Dingen Namen gibt, sei aufdie Reflexionen des Walfisch im Buch Per Anhalter durch die Galaxis vonDouglas Adams verwiesen.

Disjunkt bedeutet, dass N und T keine Elemente gemeinsam haben, also NT = . Eine Regel ist, genau genommen, ein Paar (l,r) von Worten l,r (N T ). Dasschreibt man aber nicht so hin, sondern eben als l r.

Den Umstand, dass l ein Nonterminal enthalten muss, kann man kurz und unver-stndlich auch schreiben als l (NT ) N (NT ).

Alternative SchreibweisenFr die vier Teile einer Grammatik gibt es in der Literatur viele unterschiedliche Schreib-weisen:hier andere Schreibweisen in der LiteraturT T , GTN N , GNT N S A (Anfang), 0 (Nullter Ableitungschritt), GSP E (Ersetzungsregeln), (P auf Griechisch), GPl ` (besser lesbar), 1r 2

2-13 2-13Ein ganz einfaches Beispiel.

Ausfhrliche Beschreibung einer GrammatikDie Grammatik G hat das Terminalalphabet T = {a,b}. Das Nonterminalalphabet lautetN = {S}, enthlt nur ein Symbol, nmlich S. Dieses ist auch gleich das Startsymbol, wirbenutzen dafr auch den Buchstaben S (wie verwirrlich). Schlielich gibt es noch zweiProduktionsregeln, nmlich S aSb und S .

Ganz formale Schreibweise derselben GrammatikG =

({a,b},{S},S,{(S,aSb),(S, )}

)

2 Grammatiken2.2 Formale Grammatiken 19

Normale Schreibweise derselben GrammatikG : S aSb | Wenn nichts anderes angegeben wurde, dann ist S immer das Startsymbol. Wenn nichts anderes angegeben wurde, dann sind die in den Regeln vorkommendenGrobuchstaben die Nonterminale. Alle anderen Symbole sind Terminale.

Haben mehrere Regeln dieselbe linke Seite, so schreibt man diese nur einmal undtrennt die rechten Seiten durch einen senkrechten Strich (in TEX bitte den Befehl\mid verwenden).

2-14 2-14Zur bungSchreiben Sie folgende Grammatik ganz formal als Vier-Tupel auf:

G : S 0S0 | 1S1 | XX 0 | 1

2.2.2 Definition: Ableitungen

2-15 2-15Ableitungen = Anwenden von RegelnIdee hinter Ableitung Eine Grammatik kann man nun benutzen, um Ableitungen zu bilden. Beginnend mit dem Startsymbol ersetzt man immer wieder linke Regelseiten durchrechte Regelseiten.

Man endet, wenn nur noch Terminale vorhanden sind, das resultierende Wort nenntman ein abgeleitetes Wort.

Eigentlich wollen wir gar nicht ableiten Man beachte: In der Praxis haben wir ja schon ein Wort gegeben (beispielsweiseeinen Programmtext).

Das eigentliche Ziel ist dann herauszufinden, durch welche Ableitung(en) dieser Pro-grammtext entstanden ist.

Diesen Vorgang nennt man Parsen. Darum kmmern wir uns noch ausfhrlich, abernicht jetzt.

2-16 2-16Formale Definition eines AbleitungsschrittsI Definition: Ableitungsschritt

Sei G = (T,N,S,P) eine Grammatik. Seien u,v (N T ). Wir sagen, dass v in einemAbleitungsschritt aus u hervorgeht, geschrieben uG v oder einfach nur u v, wenn1. es eine Regel l r in P gibt, so dass2. sich u und v zerlegen lassen in der Form u = x l y und v = x r y.

Bemerkungen zur Definition: Merke: In einem Ableitungsschritt wird aus einem Wort u eine linke Regelseite her-ausgestrichen und stattdessen die zugehrige rechte Regelseite eingesetzt. Das Ergeb-nis ist dann v.

Wen es interessiert: G setzt bestimmte Worte mit anderen in Relation, es handeltsich also um eine Relation auf Worten.

Ganz formal gilt also: G (NT ) (NT ). Statt schreibt man manchmal auch ` oder auch .

BeispielSei G : S aSb | . Dann gilt:

aS aaSbbbbSSSaaa bbbSaSbSaaa

aSb abaSb 6 aSSb


2-17 2-17Formale Definition abgeleiteter Worte.I Definition

Sei G = (T,N,S,P) eine Grammatik. Eine Ableitungskette ist eine Folge von Worten(w1, . . . ,wn), so dass w1w2 gilt und w2w3 und w3w4 und so weiter. Wir schreibenhierfr kurz:

w1 w2 w3 wn1 wnoder noch krzer

w1 wn.

Per Definition gilt auch w w (sozusagen eine Kette der Lnge 0).

Bemerkungen:

Formal ist auch eine Relation auf Worten. Sie ist der reflexive transitive Abschlussder Relation .

Damit u v gilt, muss es eine endliche Ableitungskette geben.

2-18 2-18Beispiele von AbleitungskettenBeispielSei G : S aSb | . Dann gilt:

SS aSbS aSbaSb aSbaaSbb

und somit SS aSbaaSbb.

BeispielSei G : aS Sa. Dann gilt:

aaSaaS aSaaaS aSaaSa

und somit aaSaaS aSaaSa.

Zur Diskussion Sei G : S 0S0 | 1S1 | 2. Wie lautet die Ableitungskette fr SSS 0S0121S?

2-19 2-19Formale Definition der erzeugten SpracheI Definition: Erzeugte Sprache

Sei G = (T,N,S,P) eine Grammatik.

Wir sagen, ein Wort w T lsst sich mittels G ableiten oder auch erzeugen, wennSG w gilt.

Die Menge aller solcher Worte bildet eine Sprache, wir nennen sie die erzeugteSprache.

Wir schreiben hierfr L(G). Es gilt also:

L(G) = {w T | SG w}.

Bemerkungen:

Man kann sich das L in L(G) als einen Operator vorstellen, der Grammatiken aufdie von ihnen erzeugten Sprachen abbildet. (So wie sin in sin(x) einen Winkel xauf eine Streckenlnge abbildet.)

Ein Wort in der erzeugten Sprache enthlt immer nur Terminale und niemals Non-terminale.

BeispielSei G : S aSb | . Dann enthlt L(G) alle Worte der Form viele as, gefolgt vonderselben Anzahl an bs. In Symbolen:

L(G) = {anbn | n N}.

2 Grammatiken2.2 Formale Grammatiken 21

BeispielSei

G : S aS | BB bB |

Dann enthlt L(G) alle Worte der Form einige as, gefolgt von einigen bs. In Symbolen:

L(G) = {anbm | n,m N}.

2-20 2-20Zur bungGeben Sie in Worten oder in symbolischer Schreibweise an, welche Sprachen die folgenden

Grammatiken erzeugen:1. G1 : S 0S0 | 1S1 | 0 | 1 | .2. G2 : S SS | 0S | S0 | 0 | .

Geben sie nun umgekehrt Grammatiken an, die die folgenden Sprachen erzeugen:1. L1 = {w {0,1} | w enthlt mindestens eine 0}.2. L2 = {w {0,1} | w enthlt mindestens tausend 0en}.3. L3 = {ww | w {0,1}} (schwer).

2-21 2-21Grammatiken in der PraxisAus der Java-Dokumentation, etwas vereinfacht und in der Notation dieser Vorlesung:

This chapter presents a grammar for the Java programming language.

The grammar presented piecemeal in the preceding chapters is much better for exposition, butit is not well suited as a basis for a parser. The grammar presented in this chapter is the basisfor the reference implementation. [. . . ]

Type Identifier |Identifier |BasicType

TypeArguments Type | Type,TypeArgumentsBasicType byte | short | char | int | long |

float | double | booleanIdentifier . . .

2.2.3 Korrektheitsbeweise

2-22 2-22Zur Erinnerung: Was macht Beweise aus?Proofs In a Nutshell

Ein (mathematischer) Beweis ist ein berzeugungsversuch, bei dem ein skeptischerLeser von Beweisfhrer von der Richtigkeit einer Behauptung berzeugt werden soll.

Die Ausfhrlichkeit hngt von der Skeptizitt des Lesers ab: Bei gutglubigen Lesern reicht Das ist trivial. Bei normalen Lesern muss eine lange Folge von Argumenten kommen: Neh-men wir an, dass Foo nicht gelten wrde. Dann msste aber Bar gelten. Somit. . . und deshalb . . . und damit erst recht auch . . .

Bei ultraskeptischen Lesers muss man einen formalen Beweis fhren (siehe dieVorlesung Logik fr Informatiker).

Korrektheitsbeweise bei Grammatiken

Es ist oft nicht leicht zu erkennen, welche Sprache eine Grammatik genau erzeugt. Ein Korrektheitsbeweis fr Grammatiken ist ein Beweis dafr, dass eine Grammatiktatschlich eine bestimmte Sprache erzeugt.


2-23 2-23

1

Beweisrezept fr Korrektheitsbeweis fr Grammatiken

ZielMan will beweisen, dass eine Grammatik G eine Sprache L erzeugt.

RezeptZeige zwei Richtungen (Beweisrezept Zwei Richtungen):

1. Beginne mit Sei w L beliebig. (Beweisrezept All-Aussagen beweisen). Argu-mentiere dann, dass SG w gilt, indem eine Ableitungskette konstruiert wird (Be-weisrezepte Konstruktiver Beweis und hufig auch Fallunterscheidung). Endemit Also gilt SG w und somit L L(G).

2. Beginne mit Sei w L(G) beliebig. (Beweisrezept All-Aussagen beweisen.) Fahrefort mit Dann gilt S w. Sei S = w1 wn = w die Ableitungskette. (Be-weisrezept Namen vergeben.) Argumentiere dann, dass w L gilt. Ende mit Alsogilt w L und somit L(G) L.

2-24 2-24Ein einfaches, ausfhrliches Beispiel eines Korrektheitsbeweises.

I LemmaSei G : S aS | b. Dann gilt L(G) = {anb | n N}.

Bevor wir dies beweisen, machen wir uns erstmal klar, was berhaupt zu beweisen ist:

Es ist eine Grammatik gegeben und es wird behauptet, dass diese eine bestimm-te Sprache, nmlich {anb | n N}, erzeugt. Nennen wir diese bestimmte Spracheeinfach L.

Es gibt nur ein Nonterminal, hier ist also wohl keine Fallunterscheidung ntig. Klar scheint: alle Ableitungsketten sehen wie folgt aus:

S aS aaS anS anb

Es lassen sich also tatschlich genau die Worte aus L ableiten. Das mssen wir jetzt noch alles schn und korrekt aufschreiben.

Beweis. Sei L = {anb | n N}. Wir mssen zeigen, dass L(G) = L gilt. Dazu zeigen wirzwei Richtungen: L L(G) und L(G) L.Wir beginnen mit L L(G). Sei w L beliebig. Dann gilt w = anb fr ein n N. Wennman nun auf das Startsymbol genau n-mal die Regel S aS anwendet und dann einmaldie Regel S b, so ergibt sich folgende Ableitungskette:

S aS aaS anS anb.

Also gilt S anb = w. Also gilt w L(G) und somit L L(G).Nun bleibt L(G) L zu zeigen. Sei dazu w L(G) beliebig. Dann gilt S w via einerAbleitungskette

S = w1 wn = w.

Das Wort w1 enthlt ein Nonterminal (nmlich S). Bei jeder Regelanwendung kann dieAnzahl der Nonterminale nicht wachsen (die rechten Regelseiten enthalten ja immer nurein Nonterminal). Also enthalten alle wi hchstens ein Nonterminal.Da wn keine Nonterminale enthlt (es gilt ja w T per Definition der erzeugen Sprache),muss genau im letzten Ableitungsschritt die Regel S b angewandt worden sein. Dannmuss in allen anderen Schritte die Regel S aS angewandt worden sein. Folglich lautetedie Ableitung

S aS aaS anS anb.

Also gilt w = anb und somit w L und somit L(G) L.

2 GrammatikenZusammenfassung dieses Kapitels 23

2-25 2-25Ein schwierigerer Korrektheitsbeweis, kurz aufgeschrieben.

I LemmaSei G : S 0S0 | 1S1 | . Sei L = {w {0,1} | w = wrev, |w|mod2 = 0}. Dann giltL(G) = L.

Beweis. Fr die Richtung L L(G) sei w L beliebig. Dann gilt w = u urev fr einu {0,1}. Bilde folgende Ableitungskette: Ausgehend von S wende im i-ten Schrittdie Regel S 0S0 an, falls u[i] = 0 und sonst S 1S1. Nach |u| Schritten wende danneinmalig die Regel S an. Wir erhalten folgende Ableitungskette:

S u[1]Su[1] u[1]u[2]Su[2]u[1] u[1]u[2]u[3]Su[3]u[2]u[1] uSurev uurev.

Also gilt S uurev = w und somit w L(G).Sei nun w L(G). Dann gilt S w via einer Ableitungskette beginnend mit w1 = S undendend mit wn = w. Da das Nonterminal S nur mit der Regel S gelscht werden kann,muss diese Regel genau einmal, nmlich am Ende angewandt worden sein. Alle anderenAbleitungschritte mssen also die Regel S 0S0 oder S 1S1 angewandt haben.Man sieht nun leicht (oder zeigt dies durch Induktion), dass sich jedes wi fr i {1, . . . ,n1} darstellen lsst als wi = uiSurevi mit ui {0,1}. Da im letzten Ableitungsschritt dieRegel S verwendet wurde, gilt wn = un1 urevn1.Also gilt w = wn = un1 urevn1 L und somit L(G) L.

Zusammenfassung dieses Kapitels

2-26 2-261. (Formale) Grammatiken bestehen aus Ersetzungsregeln.2. Sie geben an, dass in einer Ableitung aus einem Wort eine linke Regelseite gestrichen

werden und durch die rechte Seite ersetzt werden darf.3. Alle nur aus Terminalen bestehenden Worte, die sich aus dem Startsymbol ableiten

lassen, bilden die erzeugte Sprache.4. In einem Korrektheitsbeweis fr eine Grammatik beweist man, dass eine Grammatik

eine bestimmte Sprache erzeugt.

Zum Weiterlesen[1] R. Reischuk. Unterlagen zum Lehrmodul Theoretische Informatik, Vorlesungsskript,

2008. Anfang von Kapitel 1.3

bungen zu diesem Kapitel

bung 2.1 Ableitungen angeben, leichtGegeben sei die folgende Grammatik ber dem Alphabet = {0,1}:

G : S A00AA 0A | 1A |

Geben Sie alle mglichen Ableitungen fr das Wort 10001 in G an.

bung 2.2 Formalen Korrektheitsbeweis fhren, mittelWelche Sprache ber = {0,1} erzeugt die Grammatik aus Aufgabe 2.1? Geben Sie einen formalenBeweis fr Ihre Behauptung an.

24 2 Grammatikenbungen zu diesem Kapitel

bung 2.3 Sprachen aus Grammatiken erkennen, mittelGeben Sie eine Ableitungskette fr das Wort aaabbababb an. Welche Sprache ber dem Alphabet = {a,b} erzeugt die folgende Grammatik? Beweisen Sie Ihre Annahme.

G : S aS | bS | aAA bBB aB | bB | a | b

bung 2.4 Grammatiken angeben, mittelEin Wort w heit Teilwort eines Wortes u , falls Worte , existieren mit w = u.Geben Sie Grammatiken fr folgende Sprachen ber = {0,1} an.1. A = {w | |w| ist ungerade}.2. B = {w | w enthlt 00 nicht als Teilwort}.3. C = {w | w enthlt eine ungerade Anzahl von Nullen}.4. D = {w | w enthlt genau drei Einsen}.

3 Die Chomsky-Hierarchie 25

3-1 3-1

Kapitel 3Die Chomsky-HierarchieRegulre Grammatiken sind auch kontextfreieGrammatiken


1. Stufen der Hierarchie kennen2. Grammatiken der richtigen Stufe zuordnen knnen3. Sprachklassen und Abgeschlossenheit verstehen

Inhalte dieses Kapitels3.1 Grammatik-Arten 263.1.1 Regulr . . . . . . . . . . . . . . . . . . 263.1.2 Kontextfrei . . . . . . . . . . . . . . . . 273.1.3 Kontextsensitiv . . . . . . . . . . . . . 28

3.2 Die Chomsky-Hierarchie 293.2.1 Sprachklassen . . . . . . . . . . . . . . 293.2.2 Stufen der Hierarchie . . . . . . . . . . 293.2.3 Abgeschlossenheit . . . . . . . . . . . . 303.2.4 Einordnung typischer Probleme . . . . . 31


Worumes heutegeht

Worumes heutegeht

Public domain

Die Chomsky-Hierarchie geht, wenig berraschend, auf Noam Chomsky zurck. Sie stelltden Versuch dar, Grammatiken danach einzuteilen, wie schwierig sie sind. Eine solcheEinteilung ist nicht so leicht wie man denken knnte, da es erstmal reichlich unklar ist,was genau eine Grammatik schwierig macht. Man knnte zum Beispiel erstmal ganznaiv annehmen, dass die Anzahl der Regeln einer Grammatik hier doch ganz entscheidendsein sollte. Dies ist aber nicht der Fall. Eine Grammatik kann gerne eine Million Regelnhaben wenn diese alle sehr hnlich sind, dann kann die Grammatik trotzdem sehreinfach sein. Ein anderes denkbares Ma ist die Lnge der Regeln. Hier stellt sichberraschenderweise heraus, dass besonders lange Regeln mit vielen Terminalen sich ehergnstig auf die Geschwindigkeit auswirken, mit der das Wortproblem fr die Grammatikentschieden werden kann.

Chomsky erkannte, dass das entscheidende Ma fr die Komplexitt einer Grammatik dieAnzahl und Position der Nonterminale auf der linken und rechten Regelseite ist. Er hatdann vier Typen von Grammatiken eingefhrt und diese, wenig originell, mit Typ 0 bisTyp 3 bezeichnet. Dabei sind Typ-0-Grammatiken die allgemeinsten, Typ-3-Grammatikendie speziellsten. Als Chomsky seine Grammatik-Typen einfhrte, konnte er noch nichtahnen, welche davon in der Praxis besonders wichtig werden wrden. Heutzutage werdenTyp-3- und Typ-2-Grammatiken sehr viel benutzt sowohl in der Theorie wie in der Praxis;Typ-1- und Typ-0-Grammatik sind hingegen hchstens von theoretischem Interesse (alsofr diese Vorlesung genau richtig).

26 3 Die Chomsky-Hierarchie3.1 Grammatik-Arten

3.1 Grammatik-Arten

3-4 3-4Was macht Grammatiken schwierig?Zur Diskussion

Welche Sprachen erzeugen die folgenden Grammatiken?

G1 : S 0A G2 : S S00100S | AA 0B 0A A0B 0C 1A A01C 0D SA0001 A000 | 000D 0EE S |

Beobachtungen

Manche Grammatiken sind einfacher zu verstehen als andere. Dabei ist nicht die Anzahl der Regeln wichtig, sondern die Art der Regeln. Besonders Regeln mit vielen Nonterminalen links und rechts machen Grammatikenschwer zu verstehen.

Je komplizierter die Regeln in einer Grammatiken sind, desto schwieriger ist es imAllgmeinen, Worte mittels dieser Grammatik zu parsen.

Unser heutiges Ziel: Grammatiken anhand der Komplexitt ihrer Regeln zu klassifizieren.

3.1.1 Regulr

3-5 3-5Die einfachsten Grammatiken: Regulre Grammatiken.

Regulre Grammatiken gehren zu den einfachsten Grammatiken. Die Regeln sind besonders einfach und gleichfrmig eben regulr.

I Definition: Regulre GrammatikEine Grammatik G = (N,T,S,P) heit regulr, wenn alle Regeln l r in P folgendeEigenschaften haben:1. l ist ein einzelnes Nonterminal, also l N.2. r enthlt hchstens ein Nonterminal und wenn, dann am Ende, also r T (T N).

Beispiel

G : S 0S | 00BB 1B | 11

3-6 3-6Was regulren Grammatiken leisten knnen.

In jedem Ableitungsschritt, bis auf den letzten, steht am Ende ein Nonterminal unddies ist auch immer das einzige Nonterminal im ganzen Wort.

Mit einer regulren Grammatik werden Worte also immer von vorne nach hintenabgeleitet.

Wie es whrend einer Ableitung weitergeht, hngt immer nur vom aktuellen Nonter-minal ab.

3-7 3-7Zur bung Geben Sie regulre Grammatiken an, die die folgenden Sprachen erzeugen:

L1 = {w {0,1} | w enthlt eine 0 und auch eine 1},L2 = {w ascii | w ist ein erlaubter Java-Bezeichner}.

3 Die Chomsky-Hierarchie3.1 Grammatik-Arten 27

3-8 3-8Regulre Grammatiken in der Praxis.

Fr strukturierte Sprachen wie html gibt es keine regulre Grammatiken. Man kann aber Teile doch mit regulren Grammatiken beschreiben. Hier beispielsweise eine Grammatik, die erlaubte (ffnende) div-Tags beschreibt mitoptionalem class-Argument.

Gdiv-tag : S

3.1.2 Kontextfrei

3-9 3-9Grammatiken, die Hierarchien beschreiben.

Kontextfreie Grammatiken beschreiben die hierarchische Struktur von Text. Nonterminale entsprechen Konzepten, die sich immer wieder rekursiv ersetzenlassen.

Regulre Grammatiken sind ein Spezialfall von kontextfreien Grammatiken.

I Definition: Kontextfreie GrammatikEine Grammatik G = (N,T,S,P) heit kontextfrei, wenn alle Regeln l r in P folgendeEigenschaften haben:

l ist ein

vorlesungsskript - tcs.uni-luebeck.de · vorlesungsskript theoretische informatik wintersemester...

Documents