wir bieten...
Dekobild im Seitenkopf ISMLL
 
Veranstaltungen im Wintersemester 2012/2013 / BSc-/MSc-Praktikum: Business Intelligence, Business Analytics und XML / Themen
Themen

BI: OLAP processing using Jaspersoft tool

Jaspersoft ist eine der führenden Open-Source Lösungen für Business Intelligence und OLAP Aufgaben. Dieses Projekt beschäftigt sich damit, mit dieser Software einen unsererseits zur Verfügung gestellten Datensatz auszuwerten. Die individuelle Themenstellung ist variabel.

BA: A URL Change-Time Recommender

Bist du noch "up-to-date"? Oder solltest du mal wieder nachsehen, ob eine für dich interessante Nachricht veröffentlicht wurde? Moment! Lass mich mal nachsehen ... Natürlich muss man nicht "wirklich" nachsehen - dafür gibt es ja Informationsdienste, die einem Mitteilungen zukommen lassen, falls sich etwas geändert hat. Aber ist man dann wirklich "up-to-date"? Und was macht das der Informationsdienst überhaupt, um seinen Nutzern "up-to-date"ness zu ermöglichen?

Faktisch kein Online-Dienst bietet einen "Push-Notification" Dienst für Änderungen an, der es anonymen Nutzern ermöglicht, sich für Änderungen zu registrieren. Der einzige Weg liegt in der periodischen Abfrage der Dienste nach Änderungen. Dieses Vorgehen hat einige Nachteile, u.A.: (1) Verbindungen werden oftmals unnötig aufgebaut und geschlossen (gerade auf Mobilgeräten ein Problem), und (2) es erzeugt eine nicht geringe (Verbindungs-)Last auf dem abgefragten Server.

Dieses Praktikumsthema nimmt sich dieser Problematik an: Welches sind optimale Zeitpunkte, mal wieder automatisiert nachzusehen, ob sich etwas geändert hat? Werden Sportartikel häufiger in den Abendstunden aktualisiert? Gibt es bei deutschen Texten tatsächlich eine Editierungshäufigkeit zwischen 7:00 - 23:00 Uhr MESZ, wohingegen englischsprachige Texte fortlaufend aktusalisliert werden?

Die Aufgaben:
  1. Lade einen Wikipedia-snapshot mit Edit-Historie herunter (z. B. http://dumps.wikimedia.org/enwiki/20120601/).
  2. Implementiere eine einfache Matrix-Faktorisierung, die Themen mit Änderungszeitpunkten in Beziehung setzt.
  3. Erweitere und Verfeinere dein Modell, indem du Hintergrundwissen hinzu fügst:
    1. Informationen zu Zeitpunkten (Wochentag, Feiertag, ...)
    2. Wortähnlichkeiten der Texte, z. B. mittels Bag of Words
    3. Artikelähnlichkeiten, inferiert aus deren expliziten Beziehungen zueinander.

XML & SWT: Semantic Task List

Die Aufgabe ist der Entwurf und Implementierung einer semantische Aufgabenliste, die die Funktionen Mehrbenutzerbetrieb, Aufgaben-Zeiterfassung und verteilte Aufgabenbearbeitung/abarbeitung miteinander verbindet. Insbesondere sollen hierbei Workflow-Aspekte berücksichtigt werden, wie z. B. das Weiterleiten von Aufgaben an andere Benutzer.

Der Fokus des Themas liegt auf der sinnvollen Benutzung von semantic Web Technologien, um den Wartungs- und Erweiterungsaufwand im Produktivbetrieb zu minimieren. Hier soll untersucht werden, inwieweit durch die Wiederverwendung bestehender Semantiken beispielsweise der Aufwand für das Hinzufügen eines neuen Aufgaben, oder Benutzertyps reduziert werden kann.

Als Ziel des Themas ist ein Showcase zu erstellen, der einen komplexen Workflow darstellt. Denkbar ist folgendes: In dem System gibt es die Agenten "Person" und "Computer". Es gibt verschiedene Aufgabentypen, z. B. "Implementierung einer Funktionalität", und "Ausführung einer Berechnung". Weiterhin gibt es verschiedene definierte Workflows, die aufeinander folgende Teil-Aufgaben zu möglichen Agenten zuweisen. Der Showcase könnte folgenden Ablauf haben: Person A gibt Person B die Aufgabe, einen Algorithmus zu implementieren. Nachdem Person B die Aufgabe fertig gestellt hat, gibt er die Aufgabe an einen Computer weiter, der automatisch eine Berechnung mit dem neu implementierten Algorithmus ausführt. Wenn der Computer die Aufgabe beendet hat, weist er Person B die Aufgabe zu, die Ergebnisse auszuwerten.