wir bieten...
Dekobild im Seitenkopf ISMLL
 
Themen für Projekte und Abschlussarbeiten
( methodischer Schwerpunkt, technischer Schwerpunkt)


Abgeschlossene Bachelorprojekte

Christina Roland 2008
Bachelor-Projekt: Maschinelle Integration von Filmdatenbanken

Das Internet ist heute die gröe verteilte Informationsquelle der Welt. Wenn man Daten aus zwei Quellen verbinden möchte, so ist eine wesentliche Aufgabe zu erkennen, welche Daten sich auf die selben Dinge beziehen. Ein typisches Anwendungsgebiet sind Preisvergleichssysteme. Diese crawlen Angebote von verschiedenen Online-Shops und müssen aus Angebotsbeschreibungen erkennen, welche Angebote sich auf die selben Produkte beziehen. Das maschinelle Lösen dieses Integrationsproblems wird unter anderem als Record Linkage, Duplicate Detection oder Object Identification bezeichnet. In dieser Arbeit soll ein vereinfachtes Problem betrachtet werden, bei dem zwei Filmdatenbanken miteinander abgeglichen werden.

Dabei sollen folgende Aufgaben bearbeitet werden:

  • Analyse der Daten.
  • Erstellung von Identifikationsregeln (d.h. wann sind zwei Filme gleich?). Optional können diese Identifikationsregeln maschinell gelernt werden.
  • Umsetzung eines Gesamtalgorithmus.
  • Auswertung der Genauigkeit des Systems.