Motivation
Das Internet ist heutzutage allgegenwärtig und aus dem Alltag nicht mehr wegzudenken. Das World Wide Web (WWW) hat ganze
Industriezweige verändert sowie neue Geschäftsmodelle erschaffen. Damit wird das Web zum Symbol für die Entwicklung von
der Industrie- zur Informationsgesellschaft.
Das Internet ist zum größten Teil für den Menschen geschaffen. Inhalte von Internetseiten können von Maschinen zwar
erfasst werden (z.B. durch Suchmaschinen), eine echte Erfassung des Kontextes sowie des Verständnis der Bedeutung ist
für Maschinen aber nur bedingt möglich. Ein sowohl für Menschen als auch für Maschinen verständliches Netz, in dem Waren
und Dienste vermittelt und Fragen verstanden sowie automatisch beantwortet werden können, wird als nächste
Evolutionsstufe des Internets bezeichnet.
Hierzu existieren zwei Ansätze. Der erste Ansatz basiert auf Methoden der künstlichen Intelligenz, die darauf abzielen,
die kognitive Wahrnehmung des Menschen auf Maschinen zu übertragen.
Ein orthogonaler Ansatz ist der des Semantic Web. Ziel ist hierbei, Inhalte für eine optimierte Verarbeitung durch
Maschinen bereitzustellen. Dies impliziert eine formale Auszeichnung von Wissen. Das Semantic Web verlangt die
Verlagerung des verteilten Netzes von der Präsentationsebene zur Datenebene. Demnach müssen Inhalte auf
Datenebene miteinander verbunden werden, um eine optimierte Informationsverarbeitung zu gewährleisten.
Prinzipien und Technologien
SNS orientiert sich an etablierten Prinzipien und offenen Technologien um Informationen bereit zu stellen:
Linked Open Data (LOD)
Linked Open Data ist eine Community-Bestrebung zur Veröffentlichung von Datensätzen. Linked Open Data definiert
Regeln und Best Practices, um Daten auf Grundlage von Web-Standards zu veröffentlichen und mit Hilfe semantischer
Technologien in Beziehung zu setzen. Der Begriff "offen" hat in diesem Zusammenhang zwei Bedeutungen: Daten sollen zum
einen frei zugänglich sein und zum anderen ausschließlich über offene Standards veröffentlicht werden. Linked Open Data
geht auf das Jahr 2006 zurück. Tim Berners-Lee veröffentlichte in diesem Jahr den Artikel Design Issues: Linked Data note.
Aus diesem Artikel ergeben sich folgende Grundprinzipien:
- Verwende URIs, um Dinge zu identifizieren
- Verwende HTTP URIs, um auf diese Dinge zugreifen zu können
- URIs sollten auf nützliche Informationen verweisen, welche mit den Standards RDF und SPARQL bereitgestellt werden
- Verwende Verweise auf andere URIs, sodass weiteres Wissen erreichbar wird
Linked Open Data ist auf die Nutzung offener Standards ausgelegt und baut auf der technischen Architektur des Internets
auf. Das erste Prinzip besagt, dass ausschließlich URIs zur Identifikation von Ressourcen genutzt werden. Hiermit werden
neben Web-Ressourcen und echten Objekten wie Personen auch abstrakte Dinge wie Beziehungen und Beschreibungen von und
zwischen Objekten verstanden.
Resource Description Framework (RDF)
Das Resource Description Framework (RDF) ist ein graphen-orientiertes Datenmodell zur
Beschreibung beliebiger Dinge in Form von Ressourcen. RDF bietet eine formale Sprache für den Wissens- bzw.
Informationsaustausch. Dinge bzw. Ressourcen werden per Uniform Resource Identifier (URI) identifiziert und mit Hilfe
von Eigenschaften und konkreten Ausprägungen beschrieben. Jede RDF-Aussage ist in Form eines Tripel modelliert und
besteht aus Subjekt, Prädikat und Objekt.
Subjekt, Prädikat und Objekt werden durch URIs referenziert. Das Objekt kann wahlweise auch durch ein String-Literal mit
optionalem Datentyp repräsentiert werden. Das Prädikat beschreibt die semantische Beziehung zwischen Subjekt und Objekt.
RDF besteht aus dem RDF-Modell und der konkreten Syntax zur Serialisierung. Das RDF-Modell beinhaltet die Menge aller
Tripel, bestehend aus Subjekten, Prädikaten und Objekten und spannt den Graphen auf. Mit RDF lässt sich aber keine
Semantik ausdrücken, da lediglich Beziehungen zwischen Dingen hergestellt werden. Die semantische Beschreibung von
Objekten und Beziehungen erfolgt über Ontologien. Ontologien nehmen bei der Verwendung die Rolle eines Vokabulars ein.
Ein Vokabular bezeichnet im RDF-Kontext eine Menge von Bezeichnern für Individuen, Beziehungen und Klassen.
Simple Knowledge Organization System (SKOS)
Das Simple Knowledge Organization System (SKOS) ist ein W3C-Standard für die Wissensrepräsentation. SKOS bietet eine auf
RDFS und OWL basierende formale Sprache für die Definition von Vokabularen, Taxonomien und Thesauri.
Während die Wissensrepräsentation innerhalb von Knowledge Organization System (KOS) seit geraumer Zeit praktiziert wird,
ist die Verarbeitung sowie der Austausch innerhalb von Computernetzwerken noch nicht alltäglich. Zu diesem Zweck wurde
SKOS entwickelt. SKOS basiert auf den Grundideen des Semantic Webs und sollte fortan die Modellierung von
wiederverwendbaren Wissensrepräsentationen über das Internet unterstützen. Ein weiteres Kriterium bei der Entwicklung
von SKOS war die einfache Transformation aus einem anderen Thesaurus-Standard.