XML Path Language

aus GlossarWiki, der Glossar-Datenbank der Fachhochschule Augsburg
Wechseln zu:Navigation, Suche

1 Definition

Die XML Path Language (XPath) ist eine Abfragesprache, die XML-Fragmente als Baum interpretiert und daraus eine Selektion einer Knotenmenge ermöglicht (Lokalisierung).

XPath wird im Rahmen des W3C-Konsortiums gemeinsam durch die XSL Working Group und XML Linking Working Group als Standard spezifiziert. Die aktuelle Version XPath 2.0 und Vorgänger tragen den finalen Status der W3C Empfehlung. XPath gilt als essentielles Fundament für weitere XML-basierte W3C-Standards wie XQuery, XSLT oder XForms.

2 Bemerkungen

Ein XPath bietet praktisch eine gefilterte Sicht auf ein unverändertes Eingabedokument, die nur interessierende XML-Knoten zeigt. Den Vorgang bezeichnet man daher auch oft als Navigation oder Addressierung in einem XML-Dokument.

3 Datenmodell

Als Datenmodell dient eine logische Interpretation geparster XML-Dokumente als baumartig geordnete Sequenz von Einheiten. Über die Ordnung bestimmen Verschachtelung und Dokumentreihenfolge. Die Einheiten heißen Knoten und können an Blattpositionen Werte atomaren Typs tragen.

Die Knotentypen umfassen:

  • Wurzelknoten (root nodes)
  • Elementknoten (element nodes)
  • Textknoten (text nodes)
  • Attributknoten (attribut nodes)
  • Namensraumknoten (namespace nodes)
  • Verarbeitungsanweisungs-Knoten (processing instruction nodes)
  • Kommentarknoten (comment nodes)

Als Wertetypen dienen:

  • XML Schema Datentypen (z.B. integer, string, ...)
  • Weitere fünf XPath-Typen (z.B. anyAtomicType, untyped, ...)

Alle Knoteneigenschaften können über Quasifunktionen (Accessors) ausgelesen werden, die z.B. den qualifizierten Namen, getragene Typ und Wert oder Eltern und Kinder in der Ordnung zurückgeben. Das Datenmodell wird mittlerweile als XQuery 1.0 and XPath 2.0 Data Model eigenständig standardisiert.

4 Lokalisierung

Ein XPath-Lokalisierungspfad ist nun ein Ausdruck, der eine Menge von 0 bis n Knoten aus diesem Baum auswählt, welche hinsichtlich sukzessiver, durch / separierter Lokalisierungskriterien übereinstimmen. Beginnt der Pfad bereits mit einem Schrägstrich, so ist er absolut d.h. beginnend von der Wurzel auszuwerten, andernfalls relativ zum Kontext. Jeder Lokalisierungsschritt präzisiert die Selektion und hat die folgende Syntax:

/<Achse>::<Knotentest><Prädikat>*

4.1 Achse

Achsen werden stets vom aktuellen Kontextknoten angelegt und grenzen die Auswahl für den nächsten Schritt auf eine Untermenge ein, die in einer bestimmten Beziehung zum Kontextknoten stehen. Diese erinnern oft an Familienbeziehungen und resultieren aus der Baumstruktur:

Xpath axes.png

Die wichtigsten Achsen umfassen:

  • self: der Knoten selber
  • child: Kinder des Knotens
  • parent: Eltern des Knotens
  • descendant: Kinder und Kindeskinder des Knotens
  • ancestor: Eltern und Vorfahren des Knotens
  • attribute: Attribute des Knotens
  • preceding: Vorhergehend in Dokumentrichtung
  • following: Nachfolgend in Dokumentrichtung
  • Kombinationen sind teils verfügbar wie z.B. descendant-or-self

4.2 Knotentest

Ein Knotentest wählt nun aus der durch die Achse eingeschränkten Menge diejenigen Knoten aus, die den Knotentest bestehen. Zur Prüfung kann man folgende Alternativen wählen:

  • Knotenname: Formulierung durch die Angabe eines Knotennamens (* dient als Wildcard).
  • Knotentyp: Formulierung durch die Angabe einer XPath-Funktion, die den Typ zurückgibt (z.B. text() für Textknoten, attribute() für Attributknoten).

4.3 Prädikate

Prädikate werden in eckige Klammern gefasst und können beliebig oft angehängt werden. Sie filtern die Knotenmenge erneut über zwei mögliche Arten:

  • Listenindex: Wählt für den Listenindex n aus der Knotenmenge nur den n-ten Knoten aus ([1] entspricht dem ersten).
  • Boolscher Ausdruck: Wählt aus der Knotenmenge nur diejenigen, die den Ausdruck auf true auswerten.

4.4 Achsenabkürzungen

Um den Schreibaufwand zu reduzieren wurden angeregt von Navigationsschematas aus Dateisystemen einige Abkürzungen für häufige Achsenschritte eingeführt:

  • child:: = /
  • descendant-or-self:: = //
  • self:: = .
  • parent:: = ..
  • attribute:: = @

4.5 Funktionen und Operatoren

XPath-Ausdrücken stehen logische, numerische, String-manipulierende oder kontextbezogene Funktionen und Operationen bereit, um Ausdrücke zu errechnen oder zu verbinden. Für eine vollständige Liste sei auf XQuery 1.0 and XPath 2.0 Functions and Operators verwiesen.

5 Beispiele

Gegeben sei folgendes XML-Eingabedokument:

<catalog>
   <product dept="Storage">
       <number>1337</number>
       <name lang="EN">SuperDrive</name>
       ...
   </product>
   <product dept="CPU">
       <number>3337</number>
       <name lang="DE">Rechengenie</name>
       ...
   </product>
   <product dept="Storage">
       <number>2337</number>
       <name lang="EN">XtremeDrive</name>
       ...
   </product>
</catalog>

  • /child::catalog und /child::* wählen hier beide den Katalogknoten
  • /child::catalog/child::product oder kurz /catalog/product selektiert die 3 Produktknoten
  • /descendant-or-self::product oder kurz //product selektiert ebenfalls die 3 Produktknoten
  • /catalog/product[@dept="Storage"] selektiert die beiden Produktknoten der Sparte Storage
  • /catalog/product[@dept="Storage"][1] schränkt diese Auswahl auf den ersten Knoten der Sparte Storage ein, also SuperDrive
  • //text() wählt alle Textknoten aus dem Dokument also 1337, SuperDrive, 33337, HighSpeedCPU, 2337, XtremeDrive
  • /catalog/product[./name/@lang="EN"] selektiert nur die Produktknoten mit einem englischen Namenselement
  • /catalog/product[./name/@lang="EN" and data(./name)="SuperDrive"] wählt entsprechend das Produkt mit dem englischen Namen SuperDrive

6 Quellen


Dieser Artikel ist GlossarWiki-konform.
In diesem Artikel sollten die Quellenangaben überarbeitet werden.
Bitte die Regeln der GlossarWiki-Quellenformatierung beachten.
Dieser Artikel sollte überarbeitet werden.
Der Inhalt sollte sprachlich verbessert werden.
Die Aussagen sollten inhaltlich verbessert bzw. präzisiert werden.