wir bieten...
Dekobild im Seitenkopf ISMLL
 
Courses in winter term 2012/13 / BSc-/MSc-Practical: Business Intelligence, Business Analytics and XML / Topics
Topics

BI: OLAP processing using Jaspersoft tool

Jaspersoft is the leading open source tool for business intelligence and OLAP operations. In this project, the student learns to create a data warehouse with this tool. Then he applies it on a real data base (provided by the lab)

BA: A URL Change-Time Recommender

Bist du noch "up-to-date"? Oder solltest du mal wieder nachsehen, ob eine für dich interessante Nachricht veröffentlicht wurde? Moment! Lass mich mal nachsehen ... Natürlich muss man nicht "wirklich" nachsehen - dafür gibt es ja Informationsdienste, die einem Mitteilungen zukommen lassen, falls sich etwas geändert hat. Aber ist man dann wirklich "up-to-date"? Und was macht das der Informationsdienst überhaupt, um seinen Nutzern "up-to-date"ness zu ermöglichen?

Faktisch kein Online-Dienst bietet einen "Push-Notification" Dienst für Änderungen an, der es anonymen Nutzern ermöglicht, sich für Änderungen zu registrieren. Der einzige Weg liegt in der periodischen Abfrage der Dienste nach Änderungen. Dieses Vorgehen hat einige Nachteile, u.A.: (1) Verbindungen werden oftmals unnötig aufgebaut und geschlossen (gerade auf Mobilgeräten ein Problem), und (2) es erzeugt eine nicht geringe (Verbindungs-)Last auf dem abgefragten Server.

Dieses Praktikumsthema nimmt sich dieser Problematik an: Welches sind optimale Zeitpunkte, mal wieder automatisiert nachzusehen, ob sich etwas geändert hat? Werden Sportartikel häufiger in den Abendstunden aktualisiert? Gibt es bei deutschen Texten tatsächlich eine Editierungshäufigkeit zwischen 7:00 - 23:00 Uhr MESZ, wohingegen englischsprachige Texte fortlaufend aktusalisliert werden?

Die Aufgaben:
  1. Lade einen Wikipedia-snapshot mit Edit-Historie herunter (z. B. http://dumps.wikimedia.org/enwiki/20120601/).
  2. Implementiere eine einfache Matrix-Faktorisierung, die Themen mit Änderungszeitpunkten in Beziehung setzt.
  3. Erweitere und Verfeinere dein Modell, indem du Hintergrundwissen hinzu fügst:
    1. Informationen zu Zeitpunkten (Wochentag, Feiertag, ...)
    2. Wortähnlichkeiten der Texte, z. B. mittels Bag of Words
    3. Artikelähnlichkeiten, inferiert aus deren expliziten Beziehungen zueinander.

XML & SWT: Semantic Task List

Die Aufgabe ist der Entwurf und Implementierung einer semantische Aufgabenliste, die die Funktionen Mehrbenutzerbetrieb, Aufgaben-Zeiterfassung und verteilte Aufgabenbearbeitung/abarbeitung miteinander verbindet. Insbesondere sollen hierbei Workflow-Aspekte berücksichtigt werden, wie z. B. das Weiterleiten von Aufgaben an andere Benutzer.

Der Fokus des Themas liegt auf der sinnvollen Benutzung von semantic Web Technologien, um den Wartungs- und Erweiterungsaufwand im Produktivbetrieb zu minimieren. Hier soll untersucht werden, inwieweit durch die Wiederverwendung bestehender Semantiken beispielsweise der Aufwand für das Hinzufügen eines neuen Aufgaben, oder Benutzertyps reduziert werden kann.

Als Ziel des Themas ist ein Showcase zu erstellen, der einen komplexen Workflow darstellt. Denkbar ist folgendes: In dem System gibt es die Agenten "Person" und "Computer". Es gibt verschiedene Aufgabentypen, z. B. "Implementierung einer Funktionalität", und "Ausführung einer Berechnung". Weiterhin gibt es verschiedene definierte Workflows, die aufeinander folgende Teil-Aufgaben zu möglichen Agenten zuweisen. Der Showcase könnte folgenden Ablauf haben: Person A gibt Person B die Aufgabe, einen Algorithmus zu implementieren. Nachdem Person B die Aufgabe fertig gestellt hat, gibt er die Aufgabe an einen Computer weiter, der automatisch eine Berechnung mit dem neu implementierten Algorithmus ausführt. Wenn der Computer die Aufgabe beendet hat, weist er Person B die Aufgabe zu, die Ergebnisse auszuwerten.