Semantische Technologien – Was ist RDF?

04. April 2011
Semantische Technologien – Was ist RDF?

In diesem Blog wollen wir ja vor allem die Business-Perspektive des Semantic Web tiefer betrachten. Dabei kommen wir natürlich nicht umhin, auf die zugrundeliegende Technologie einzugehen. Auf die Kern-Technologien, die auch in unseren Artikeln immer wieder genannt werden möchte ich deshalb auch einmal etwas tiefer eingehen. Beginnen werde ich heute mit RDF, der Basis-Technologie des Semantik Web. Was ist RDF? RDF steht für Ressource Description Framewok und ist, wie HTML, ein W3C Standard. Wohingegen mit HTML der Aufbau von Web-Seiten standardisiert beschrieben wird, ist RDF ein Standard zum Datenaustausch im Web.

Ein wesentlicher Unterschied zu bereits bestehenden Datenmodellen, wie zum Beispiel dem relationalen Modell ist, dass bei RDF die Informationen als Graph repräsentiert werden und alle Objekte durch Links verbunden sind. Um das klar zu machen, eignet sich am besten ein einfaches Beispiel. Nehmen wir den Satz “Dresden ist eine Stadt in Sachsen”. Hier sind die beiden Objekte “Dresden” und “Sachsen” verbunden durch den Link “eine Stadt in”. In RDF werden alle Informationen als Tripel aus Subjekt (Dresden), Prädikat (eine Stadt in) und dem Objekt (Sachsen) repräsentiert. Das ist im Kern schon alles.
Stellt sich noch die Frage wozu braucht man das alles. HTML beschreibt standardisiert den Aufbau von Webseiten. Das hat dazu geführt, dass Webseiten zum Großteil unabhängig vom verwendeten Browser in einer einheitlichen Form betrachtet werden können. Das gleiche soll RDF für Daten gewährleisten.

Natürlich werden auch heute schon Daten über das Web bereitgestellt allerdings erfolgt das über individuelle Formate und Schnittstellen. Will man diese Daten aggregieren und daraus neue Applikationen gestalten, so müssen die verschiedenen Schnittstellen individuell angebunden und in ein neues, wiederum individuelles Format gebracht werden. Darüber hinaus sind heute noch viele Daten direkt in Webseiten, also in HTML enthalten. Für eine Verwendung dieser Daten müssen diese dann individuell aus der Website extrahiert werden. Das alles bedeutet zum einen einen sehr hohen Aufwand, zum anderen schränkt es die tatsächliche Verwendbarkeit der Daten und die damit verbundene Qualität stark ein. Das ändert sich bei der Verwendung von RDF. Damit entfällt die Transformation von Daten, da alle im selben Modell bereitgestellt und verwendet werden können.

Darüber hinaus können einzelne Graphen wiederum durch Links verbunden werden, was als “Linked Data” Konzept verstanden wird. Dabei geht es vor allem um das Ziel, verschiedene Informationen zu einem Thema so zu verlinken, dass ein strukturiert navigiert werden können.

RDF ist ein Datenmodell, welches in verschiedenen Formaten repräsentiert werden kann, so z.B. XML (RDF/XML), HTML (RDFa) oder JSON. RDF selbst ist schemalos, es existieren aber verschiedene Schemata wie z.B. OWL (ontology web lanquage) oder RDF Schema. Weiterhin existiert mit SPARQL auch eine an SQL mangelehnte Query Language für RDF. Zu all diesen Dingen werde ich später in diesem Blog noch weiter eingehen.

Das RDF zunehmend an Bedeutung gewinnt, sieht man an der ständig zunehmenden Zahl von semantischen Applikationen, die alle RDF als Datenmodell verwenden. Aus meiner Sicht viel wesentliche ist aber die zunehmende Durchdringung im “allgemeinen” Web. Beispiele dafür wurden mit der auf RDF basierenden Google Receipt Search schon in diesem Blog gegeben.

Neuen Kommentar schreiben