Parser

Aus Online Marketing Wiki
Wechseln zu: Navigation, Suche


Der Begriff Parser (engl. für Teil bzw. Zerteiler) beschreibt ein Computerprogramm, welches eine Eingabe in eine für die Weiterverarbeitung verwendbares Format zerlegt und umwandelt. Ein Parser ist oft Teil eines Compliers.

Funktionsweise

Die Parser zerlegen den Text meist, mit Hilfe eines separaten lexikalischen Scanners, da so die Eingabedaten in die einzelnen Token zerlegt werden können z.B. in Wörter. Dem Parser dienen die Token daraufhin als Eingabezeichen. Der Parser führt eine syntaktische Analyse der Inputdaten durch und entwickelt so einen eigenen Syntaxbaum, den sog. Parse Baum. Der Syntaxbaum kann anschließend für die Weiterverarbeitung der Daten verwendet werden. Der Parser ist die Software, zur Überprüfung der Anweisungen im Quelltext, zur Weiterverarbeitung und zur Weiterleitung.

Typen von Parsern

  • Top-Down-Parser: Bei dieser Methode arbeitet der Parser zielorientiert. Der Parser startet bei dem Startsymbol der Syntax und sucht nach einer passenden, syntaktischen Ableitung. Der Parse Baum entsteht, indem er von oben nach unten immer detaillierter wird. Bsp.: LF-Parser, LL-Parser
  • Bottom-Up-Parser: Der Parser geht hierbei von den Token des Eingabesatzes aus und versucht nach und nach syntaktische Zusammenhänge zu erkennen. Der Parser endet, sobald er das Startsymbol der Grammatik erreicht hat.
  • Chart Parser
  • Left-Corner-Parser

Anwendung und Beispiele

Die übergeordnete Aufgabe eines Parsers ist die Umwandlung eines Texts in eine neue Struktur z.B. in einen Sytaxbaum, mit welchem die Elemente in einer Hierarchie ausgedrückt werden.

  • Der Parser in einem Webbrowser wandelt den HTML -Code, bestehend aus reinem Text, in einen logischen Aufbau als Datenstruktur um.
  • URL-Parser können komplexe Schemata in ihre Einzelteile aufgliedern, wie z.B. URLs in ihren hierarchischen Aufbau.
  • Suchmaschinen extrahieren die Textbereiche von heruntergeladenen Webseite mit Hilfe von Crawlern, die für sie relevant sind, sie parsen sie so zu sagen. Diese Bereiche werden aufgearbeitet und anschließend können die geparsten Daten für die Durchsuchung genutzt werden
  • Zum Auslesen einer Programmiersprache wird ein Parser benötigt, dieser stellt dem Complier am Ende eine Datenstruktur zur Verfügung. Daraufhin kann der Complier den Maschinencode bzw. Bytecode erzeugen.