530 likes | 729 Views
Formale Sprachen Teil 3. Klaus Becker 2006. Syntax und Semantik. Teil 1. Mini-Programmiersprache. Zielsetzung.
E N D
Formale SprachenTeil 3 Klaus Becker 2006
Teil 1 Mini-Programmiersprache
Zielsetzung Ziel ist es, für eine einfache Programmiersprache einen Interpreter und einen Compiler zu entwickeln. Die hier betrachtete Programmiersprache orientiert sich an der Sprache zur Steuerung des Roboters Karol. hinlegenschrittwiederhole solange NichtIstZiegel wiederhole solange NichtIstWand schritt *wiederhole linksDrehen*wiederhole
Die Programmiersprache Zur Vereinfachung der Darstellung verwenden wir abkürzende Bezeichner für die Anweisungen der Programmiersprache. h swh nz wh nw s *wh l*wh hinlegenschrittwiederhole solange NichtIstZiegel wiederhole solange NichtIstWand schritt *wiederhole linksDrehen*wiederhole
Die Programmiersprache MyKa Elementare Anweisungen:h „Ziegel hinlegen“a „Ziegel aufheben“s „Schritt vorwärts“l „links drehen“r „rechts drehen“ h swh nz wh nw s *wh l*wh Elementare Bedingungen:nz „nicht auf Ziegel“nw „nicht vor Wand“ Kontrollanweisung:wh ... ... „wiederhole solange ...“ *wh Ein MyKa-Programm setzt sich – wie im Beispiel gezeigt – aus elementaren und Kontrollanweisungen zusammen. Bei der Darstellung von MyKa-Programmen dürfen mehrere Anweisungen in eine Zeile geschrieben werden, ...
Zweistufige Sprachbeschreibung Oft ist es sinnvoll, eine formale Sprache zweistufig festzulegen: Zeichen: Zeilenumbruch Zeilenumbruch {ASCII: a, b, c, ..., ´*´, ´ ´, chr(13), chr(10), ...} Alphabet für Token Festlegung der korrekten Token (Wörter) Sprache der Token Wörter / Token: {h, a, s, l, r, nz, nw, wh, *wh} Alphabet für Programme Festlegung der korrekten Tokenfolgen (Sätze) Sprache der Programme Sätze / Tokenfolgen: {h s wh nz wh nw s *wh l *wh , ...}
Eine Grammatik für MyKa ! Terminalsymbole S = s L = l R = r H = h A = a NW = n w NZ = n z WHA = w h WHE = '*' w h ... MyKa1.grm ... "Start Symbol" = <Programm> ! Produktionen <Programm> ::= <Anweisungsfolge> <Anweisungsfolge> ::= <Anweisung> <Anweisungsfolge> ::= <Anweisung> <Anweisungsfolge> <Bedingung> ::= NW <Bedingung> ::= NZ <Anweisung> ::= S <Anweisung> ::= L <Anweisung> ::= R <Anweisung> ::= H <Anweisung> ::= A <Anweisung> ::= WHA <Bedingung> <Anweisungsfolge> WHE
Aufgabe Starten Sie das Werkzeug „GOLD Parser Builder“ und laden Sie die Datei „MyKa1.grm“. Testen Sie die hier vorgegebene Grammatik zur präzisen Festlegung der Programmiersprache MyKa.
Es fehlt die Semantik Bisher wurde nur die Syntax der Sprache MyKa festgelegt. Die Bedeutung der einzelnen Sprachelemente scheint klar zu sein. Aber ist das wirklich so? Bereits bei der elementaren Anweisung „h“ ist nicht klar, wie viele Ziegel hingelegt werde, ob der / die Ziegel in die Zelle, in der sich der Roboter befindet, gelegt werden, oder in die vor dem Roboter usw. . Ziel ist es im Folgenden, auch die Semantik der Programmiersprache exakt zu beschreiben. Zwei Ansätze sollen hierzu vorgestellt werden: Zum einen soll die Bedeutung der Konstrukte der Sprache MyKa durch das Verhalten eines Interpreters festgelegt werden (Interpreteransatz). Zum anderen soll die Bedeutung von Konstrukten der Sprache MyKa auf die Bedeutung der Konstrukte einer anderen (bereits bekannten) Sprache zurückgeführt werden (Übersetzeransatz). Letztlich werden hier somit ein Interpreter und ein Übersetzer (Compiler) für die Programmiersprache MyKa entwickelt. Zur syntaktischen Vorbereitung werden zudem ein Scanner und ein Parser für diese Sprache benutzt.
Teil 2 Scanner und Parser
Syntaxanalyse Zur Analyse der Syntax der Sprache MyKa sollen im Folgenden ein Scanner und ein Parser entwickelt werden. Nach der Syntaxanalyse soll feststehen, ob eine vorgegebene Zeichenfolge ein syntaktisch korrektes MyKa-Programm darstellt. h swh nz wh nw s *wh l*wh
Scanner Aufgabe eines Scanners ist es, aus einer Zeichenfolge lexikalische Einheiten zu bilden und diese als Tokenfolge aufzubereiten. h swh nz wh nw s *wh l*wh Scanner Scanner-Automat h s wh nz wh nw s *wh l *wh
Scanner-Automat Der Scanner benutzt einen endlichen Automaten zur Erkennung der lexikalischen Einheiten. q1 zw q2 ´ ´; chr(13); chr(10) h w n q3 w * s; l; r; h; a ´ ´; chr(13) q0 q10 q20 Immer dann, wenn der Endzustand erreicht wird, ist ein Token erkannt. Danach beginnt der Scanner seine Arbeit wieder im Anfangszustand. q30 Fehlerzustand
Parser Aufgabe eines Parsers ist es, eine Tokenfolge auf syntaktische Korrektheit zu analysieren (und evtl. die Tokenfolge geeignet aufzubereiten). h s wh nz wh nw s *wh l *wh Parser Parser-Automat Ok!
Parser-Automat Der Parser benutzt einen Kellerautomaten zur syntaktischen Analyse der Tokenfolge. Oberstes Kellerzeichen / Eingabezeichen: Kelleroperation any / s : any / l :any / r : any / h :any / a :wh / *wh : pop Der Kellerautomaten akzeptiert eine Zeichenfolge, wenn der Automat nach Abarbeitung der Zeichenfolge im Enzustand ist und wenn zudem der Keller leer ist. q1 any / wh : push wh any / s : any / l :any / r : any / h :any / a :any / wh :any / *wh : any / nz : any / nw : q0 else / *wh : any / nz :any / nw : q2 Fehlerzustand
Aufgabe Testen Sie den implementierten Scanner. Schauen Sie sich die Implementierung an. Berücksichtigen Sie beim Scanner-Automaten zusätzlich folgende Kontrollanweisung: if <Bed.> th <Anw.> el <Anw.> *if Ergänzen Sie die Implementierung des Scanner-Automaten entsprechend und testen Sie den erweiterten Scanner.
Aufgabe Testen Sie den implementierten Parser. Schauen Sie sich die Implementierung an. Berücksichtigen Sie beim Parser-Automaten zusätzlich folgende Kontrollanweisung: if <Bed.> th <Anw.> el <Anw.> *if Ergänzen Sie die Implementierung des Parser-Automaten entsprechend und testen Sie den erweiterten Parser.
Teil 3 Ein Programm-Interpreter
Interpreter Ein Interpreter führt die Anweisungen Schritt für Schritt aus. Er beschreibt damit das Verhalten der jeweiligen Anweisungen. Eine präzise Interpreter-beschreibung kann somit zur Festlegung der Semantik der Elemente der Programmier-sprache benutzt werden (Interpreter-Semantik). h s wh nz wh nw s *wh l *wh Zustand vorher: abzuarbeitendes Programm; Roboterwelt Zustand nachher: abzuarbeitendes Programm; Roboterwelt
Ausführungstransformationen 1 wahr h s wh nz wh nw s *wh l *wh wh nzwh nw s *wh l*wh 1 s wh nz wh nw s *wh l *wh wh nws *whl wh nz wh nw s ... ...
Ausführungstransformationen 1 1 wahr wahr wh nws*whl wh nz wh nw s ... wh nws*whl wh nz wh nw s ... 1 1 s wh nw s *whl wh nz wh nw s ... s wh nw s *whl wh nz wh nw s ... ...
Ausführungstransformationen 1 1 falsch wahr wh nws*whl wh nz wh nw s ... wh nz wh nw s *wh l *wh 1 1 l wh nz wh nw s *wh l *wh wh nws *whl wh nz wh nw s ... ...
Transformationsregeln Vor der Wand s ... s ... ... ...
Transformationsregeln Anzahl: n h ... h ... Anzahl: n+1 ... ...
Transformationsregeln wahr falsch wh <B> <K> *wh ... wh <B> <K> *wh ... <K> wh <B> <K> *wh ... ...
Semantikfestlegung mit Regeln Das Verhalten des Interpreters wird hier präzise mit Hilfe von Transformationsregeln festgelegt. Diese bilden somit die Grundlage für eine Implementierung des Interpreters. s ... Solange d. Restprogramm-Stapel nicht leer ist wende die zum obersten Stapelelement passende Transformationsregel an ...
Aufgabe Testen Sie den implementierten Interpreter. Schauen Sie sich die Implementierung an. Entwerfen Sie Transformationsregeln, die die Ausführung der folgenden Kontrollanweisung beschreiben: if <Bed.> th <Anw.> el <Anw.> *if Ergänzen Sie die Implementierung des Interpreters entsprechend der Transformationsregeln.
Teil 4 Ein Programm-Übersetzer
Übersetzer Ein Übersetzer transformiert Programme der Ausgangs-Programmiersprache (Quellsprache) in eine andere Sprache (Zielsprache). Eine präzise Übersetzer-beschreibung kann zur Festlegung der Semantik der Elemente der Ausgangs-Programmiersprache benutzt werden, sofern die Semantik der Zielsprache klar ist (Übersetzer-Semantik). h s wh nz wh nw s *wh l *wh Zustand vorher: abzuarbeitendes Programm; Roboterwelt Zustand nachher: abzuarbeitendes Programm; Roboterwelt h s nz 10 nw 8 s 4 l 2
Von der Quell- zur Zielsprache h s wh nz wh nw s *wh l *wh h s nz 10 nw 8 s 4 l 2 h s wh nz wh nw s *wh l *wh Die Quellsprache MyKa verfügt über die Kontrollstruktur wh ... *wh zur Ausführung von Wiederholungen. Die Zielsprache soll solche Wiederholungen durch GOTO-Sprünge ersetzen. 0 h 1 s 2 falsch nz? 3 wahr 4 falsch nw? 5 wahr 6 s 4 8 l 9 10
Von der Quell- zur Zielsprache h s wh nz wh nw s *wh l *wh h s nz 10 nw 8 s 4 l 2 h s wh nz wh nw s *wh l *wh 0: h 1: s 2: nz? 3: f: goto 10 4: w: nw? 5: f: goto 8 6: w: s 7: goto 4 8: l 9: goto 210: stop 0: h 1: s 2: nz 3: 10 4: nw 5: 8 6: s 7: 4 8: l 9: 210: 0 h 1 s 2 falsch nz? 3 wahr 4 falsch nw? 5 wahr 6 s h s nz 10 nw 8 s 4 l 20 1 2 3 4 5 6 7 8 9 4 8 l GOTO-Programme werden in verkürzter Form als Folge von Token (siehe oben) dargestellt. 9 10
Übersetzungsvorgang im Detail h s wh nz wh nw s *wh l *wh wh nz wh nw s *wh l *wh 0 2 h s s wh nz wh nw s *wh l *wh nz wh nw s *wh l *wh 1 2 2 h h s ...
Übersetzungsvorgang im Detail nz wh nw s *wh l *wh nw s *wh l *wh 2 2 4 4 2 h s h s nz * wh nw s *wh l *wh s *wh l *wh 4 2 6 4 2 h s nz * h s nz * nw * ...
Übersetzungsvorgang im Detail s *wh l *wh l *wh 6 4 2 8 2 h s nz * nw * h s nz * nw 8 s 4 *wh l *wh *wh 7 4 2 9 2 h s nz * nw * s h s nz * nw 8 s 4 l ...
Übersetzungsvorgang im Detail *wh 9 2 h s nz * nw 8 s 4 l 10 h s nz 10 nw 8 s 4 l 2
Transformationsregeln Quellcode Das Verhalten des Übersetzers kann präzise mit Hilfe von Transformationsregeln festgelegt werden. s ... i ... ... Solange die Quellcode-Schlange nicht leer ist wende die passende Transformationsregel an Zielcode Markenzähler Hilfsstapel für Rücksprungmarken ... i+1 ... Diese bilden dann die Grundlage für eine Implementierung des Übersetzers. ... s
Regel für eine elementare Anweisung Eine elementare Anweisung wird direkt in die Code-Schlange übernommen. Der Markenzähler wird um 1 erhöht. s ... i ... ... ... i+1 ... ... s
Regel für die Wiederhole-Anweisung Die aktuelle Markennummer wird zur späteren Festlegung der Rücksprungadresse in einem Hilfsstapel zwischengespeichert. wh ... i ... ... ... i i ... ...
Regel für die Wiederhole-Anweisung Die Bedingung wird in die Code-Schlange übernommen. Zusätzlich wird ein Platzhalter (hier *) übernommen, der später mit einer Marke für einen Vorwärtssprung ersetzt wird. Hiermit soll ein Sprung aus der Schleife ermöglicht werden, wenn die Bedingung nicht erfüllt ist. Des weiteren wird der Markenzähler um 2 erhöht. Hiermit soll ein Sprung zur ersten Anweisung innerhalb der Schleife ermöglicht werden, sofern die Bedingung erfüllt ist. <B> ... i ... ... ... i+2 ... ... <B> *
Regel für das Ende einer Wiederholung Die auf einem Hilfsstapel abgelegte Rücksprungmarke wird in die Codeschlange übernommen. Zusätzlich wird das letzte * in der Codeschlange durch den neuen Markenzähler ersetzt. Hierdurch wird der Sprung „aus der Schleife“ realisiert. *wh ... i k ... ... * … ... i+1 ... ... i+1 … k
Aufgabe Testen Sie den implementierten Compiler. Schauen Sie sich die Implementierung an. Entwerfen Sie Transformationsregeln, die die Übersetzung der folgenden Kontrollanweisung beschreiben: if <Bed.> th <Anw.> el <Anw.> *if Ergänzen Sie die Implementierung des Compilers entsprechend der Transformationsregeln.
Teil 5 Aufgaben und Lösungsvorschläge
Aufgabe Erweitern Sie die Programmiersprache um folgende Kontrollanweisung: if <Bed.> t <Anw.> e <Anw.> *if Ergänzen Sie entsprechend den Scanner, den Parser, den Interpreter und den Übersetzer (Codegenerator).
Die Programmiersprache Zur Vereinfachung der Darstellung verwenden wir abkürzende Bezeichner für die Anweisungen der Programmiersprache. wh nw if nz th h s el s *if*wh hinlegenschrittwiederhole solange NichtIstZiegel wiederhole solange NichtIstWand schritt *wiederhole linksDrehen*wiederhole
Erweiterter Scanner-Automat q1 zw q2 ´ ´; chr(13); chr(10) h w n q3 w * i s; l; r; h; a; t; e ´ ´; chr(13) q0 q10 q20 i f t q4 e h q5 l q30 q6 Fehlerzustand
Erweiterter Parser-Automat Oberstes Kellerzeichen / Eingabezeichen: Kelleroperation any / s : any / l :any / r : any / h :any / a :wh / *wh : popif / *if : popany / th : push thth / el : pop q1 any / wh : push whany / if : push if any / nz : any / nw : q0 else / *wh : any / nz :any / nw : q2 Fehlerzustand
Zusätzliche Regeln f. d. Interpreter wahr falsch if <B> th <A1> el <A2> *if ... if <B> th <A1> el <A2> *if ... <A1> ... <A2> ...
Aufgabe Beschreiben Sie die Arbeitsweise des Code-Interpreters mit Hilfe geeigneter Transformationsregeln. Ergänzen Sie hierzu den folgenden Lösungsvorschlag.
Lösungsvorschlag i ... >s ... i+1 ...s >...