wir bieten...
Dekobild im Seitenkopf ISMLL
 
Courses in winter term 2009/10 / MSc Project XML and Semantic Web
Abstract

The praktikum allows students to gain practical knowledge and capabilities in the usage of XML and semantic web technologies (XML, XML Schema, XSLT, XQuery, RDF, RDFS, OWL, query languages and inferencing) in different application scenarios.

  • Each topic is intended for a small group of 3-4 students.
  • Software should be written in Java or C++. Exceptions may be discussed upon request.
  • Final talks can be given in English or German.
  • Each topic consists of a generic tool and its proof-of-concept application in an example domain.

Organisation:

  • Groups can start immediately.
  • Each group is supposed to give at least two presentations:
    • a first presentation introducing the concept and plan (as early as possible, mid November latest)
    • optional, but highly desired: a second presentation about ongoing work, showing a first implementation and commenting on problems (before Christmas),
    • a final presentation of the whole work (end of term).

Registration:

  • You can register for topics from now via email (busche@ismll.uni-hildesheim.de).
  • Topics will assigned in order of arrival of registration emails .
  • If you state several topcis in decreasing preference, you will get assigned the first one that is available.
  • Registration of pre-formed groups is preferred.

Topics: ( methodological focus, technical focus)

available
1. Semantic Task List
example domains: workflow management, company productivity.

Die Aufgabe ist der Entwurf und Implementierung einer semantische Aufgabenliste, die die Funktionen Mehrbenutzerbetrieb, Aufgaben-Zeiterfassung und verteilte Aufgabenbearbeitung/abarbeitung miteinander verbindet. Insbesondere sollen hierbei Workflow-Aspekte berücksichtigt werden, wie z. B. das Weiterleiten von Aufgaben an andere Benutzer.

Der Fokus des Themas liegt auf der sinnvollen Benutzung von Ontologien, um den Wartungs- und Erweiterungsaufwand im Produktivbetrieb zu minimieren. Hier soll untersucht werden, inwieweit durch die Wiederverwendung bestehender Semantiken beispielsweise der Aufwand für das Hinzufügen eines neuen Aufgaben, oder Benutzertyps reduziert werden kann.

Als Ziel des Themas ist ein Showcase zu erstellen, der einen komplexen Workflow darstellt. Denkbar ist folgendes: In dem System gibt es die Agenten "Person" und "Computer". Es gibt verschiedene Aufgabentypen, z. B. "Implementierung einer Funktionalität", und "Ausführung einer Berechnung". Weiterhin gibt es verschiedene definierte Workflows, die aufeinander folgende Teil-Aufgaben zu möglichen Agenten zuweisen. Der Showcase könnte folgenden Ablauf haben: Person A gibt Person B die Aufgabe, einen Algorithmus zu implementieren. Nachdem Person B die Aufgabe fertig gestellt hat, gibt er die Aufgabe an einen Computer weiter, der automatisch eine Berechnung mit dem neu implementierten Algorithmus ausführt. Wenn der Computer die Aufgabe beendet hat, weist er Person B die Aufgabe zu, die Ergebnisse auszuwerten.

available
2. Semantic Recommender Systems
example domains: Amazon/IMDb.

Die Aufgabe umfasst den Entwurf und die Implementierung eines semantischen Recommender-Systems, das unter Ausnutzung semantischer Beziehungen dem Benutzer (personalisierte) Empfehlungen gibt. Hierzu ist eine Ontologie zu designen, mit der Produkte, Personen, und Bewertungen abgebildet werden können.

Der Fokus des Themas liegt auf der Untersuchung, ob die durch RDF/OWL zur Verfügung stehenden semantischen Beziehungen das Empfehlungsergebnis verbessern können, oder nicht, und zu welchen Kosten dies erreicht wird.

Mögliche Anwendungsgebiete sind: IMDB (Film-Recommender); traditionelle Recommender-Datensätze (durch Induzierung einer Ontologie).

David Crowder, Nils-Peter Schirrmeister
3. Graphical Ontology Visualization
example domains:

Die Aufgabe ist der Entwurf und die Implementierung eines Visualisierungsprogramms/einer Visualisierungstechnik für Ontologien, welches Inhalte und Zusammenhänge (Konzepte, Individuen, Properties) als Graphen-Struktur anzeigt. Anders als bestehende formularbasierte (Editier-)Werkzeuge (z. B. Protegé), die sich gerade für Einsteiger schnell als "überladen" darstellen, soll durch die Darstellung als Graph erreicht werden, dass einfache Zusammenhänge (z. B. Properties, deren Domain oder Range auf einem super-Konzept definiert sind) auch ebenso dargestellt werden.

Der Fokus des Themas liegt auf der Untersuchung graphischer Visualisierungstechniken für Ontologien, mit denen die Komplexität der Ausdrucksmächtigkeit von OWL auf einfache visuelle Elemente abgebildet werden kann. Über eine solche vereinfachte Darstellung kann z. B. erreicht werden, dass die Formulierung von SPARQL-Queries gegen komplexe Ontologien (komplexe Hierarchie mit komplexen Properties) vereinfacht wird. Es soll ferner untersucht werden, ob durch die Definition externer Regeln (z. B. während der Navigation ein Austauschen bestimmter Teile der Ontologie mittels einer CONSTRUCT-Query, um z. B. Daten der Quell-Ontologie zu aggregieren) die Ausdrucksstärke weiter erhöht werden kann.

Im Anschluss an die erfolgreiche Umsetzung kann versucht werden, einfache Manipulationsoperationen hinzuzufügen.

available
4. Ontology-based Information Extraction
example domains:

Die Aufgabe beinhaltet den den Entwurf und die Implementierung eines einfachen Information Extraction Systems, das auf der Grundlage von durch RDF oder OWL-annotierten Daten Extraktionsregeln lernt, um diese in einem nachfolgenden Schritt auf unbekannte Daten anzuwenden. Das Ergebnis der Extraktion sind wiederum RDF, bzw. OWL Repositories/Ontologien.

Der Fokus dieses Themas liegt auf der Untersuchung der Möglichkeiten einer Einbeziehung der durch RDF/OWL gegebenen Inferenztechniken (z. B. können transitive oder symmetrische Eigenschaften das Extraktionsergebnis verbessern?). Vorwissen in machinellem Lernen ist von Vorteil.

Mögliche Anwendungsgebiete sind: Extraktion aus unformatiertem oder semi-strukturiertem (z. B. HTML) Text, Entitäten-Extraktion aus Wikipedia. Nach Absprache möglich wären auch andere Medientypen, z. B. Bilder.

 
Practical
Time:Mon, 14:00-18:00
Location:B26, Spl.
Start:26 OCT 2009
Assignment:WI/IMIT KI+ML MSc
Preliminary talk:
Time:Mon, 13 July 2009,
16:00 c.t.
Location:B26
Delivery:
Time: by arrangement
Last Seminar: here