My master thesis is released under the terms of Creative Commons Attribution-ShareAlike 3.0 Unported. So feel free to use it for your own work.
Key words: DataCube, Linked Data Mashup, Statistics, Visualization
This thesis is related to Semantic Web and Statistics. It describes a couple of necessary concepts in Semantic Web and Mashup. Additionally, it introduces you to the DataCube vocabulary and how to interpret it. The main part of this work is devided in two parts: a model about merging datasets and an introduction about modifications and extensions for the component CubeViz. The model describes on which levels and under circumstances to merge datasets. Afterwards a comprehensive description of extensions and adaptions on CubeViz takes place. The purpose of the modifications on CubeViz was to improve it to help you explore and compare datasets.
Bei der Exploration statistischer Daten suchen wir oftmals buchstäblich die Nadel im Heuhaufen. Doch in den letzten Jahren wurde mit dem Aufkommen der Repräsentation von statistischen Daten im RDF-Format eine Tür in einen Raum voller Möglichkeiten aufgestoßen. Mithilfe von RDF und anderen Semantic Web Technologien besitzen wir nun neben der semantischen Beschreibung der Daten nun auch die Möglichkeit, inhaltliche Schlüsse zuziehen und Zusammenhänge zu erkennen. Damit sind bessere Methoden bei der Exploration und Visualisierung von Statistiken möglich. Mit dieser Arbeit soll ein Beitrag zum Themenfeld der Exploration statistischer Daten geleistet werden. Es werden dafür Konzepte aus dem Bereich des Linked Data und Semantic Web vorgestellt und so miteinander verknüpft, dass darauf basierend ein Modell erarbeiten werden kann. Dies stellt eine Vorgehensweise vor, wie man zwei statistische Datensätze zusammenführt. Dabei wird beschrieben, unter welchen Gesichtspunkten eine Zusammenführung möglich ist und welche weiteren Schritte nötig sind, um am Ende wieder einen vollwertigen Datensatz zu erhalten. Unter Verwendung des DataCube Vokabulars werden die Daten modelliert, wobei im Rahmen der Arbeit eine eigene Interpretation des Vokabulars beschrieben wird. All diese Arbeiten gipfeln in einer Erweiterung der Software CubeViz. Es wird beschrieben, was angepasst und welche Erweiterungen eingebaut wurden. Damit soll CubeViz einerseits eine effizientere und informativere Exploration von statistischen Daten im RDF-Format ermöglichen und andererseits eine vergleichende Übersicht und Zusammen- führung von Datensätzen ermöglichen.