Information Systems and Machine Learning Lab, University of Hildesheim, Germany

Courses in winter term 2015 / Oberseminar on Machine Learning and Data Mining:

Sessions:

Tue. 13.05.14 Moritz Gutowski (BSc WI):

Evaluierung von Algorithmen und Techniken zum Spielen und Loesen von Dots and Boxes

Abstract:

Ziel dieser Arbeit ist es, unterschiedliche Algorithmen und Techniken vorzustellen und zu vergleichen, die verwendet werden, um das Papier-und-Stift-Spiel Dots and Boxes (dt. Kaesekaestchen) zu loesen oder erfolgreich zu spielen.
In diesem First-Idea-Talk wird das Spiel vorgestellt und in der kombinatorischen Spieltheorie eingeordnet. Es folgt eine Vorstellung der fuer Dots and Boxes spezifischen Techniken, wie Ketten und Symmetrie. Abschliessend folgt eine erste Uebersicht und Vorstellung der in der Arbeit zu evaluierenden Algorithmen z.B. Retrograde Analyse oder die Minimax-Algorithmus-Varianten Negamax und Alpha-Beta-Suche.

Thu. 24.04.14 (12:00 - 14:00, B26) Prof. Dr. Ulf Brefeld:

Summarising Related Sentences

Abstract:

We cast multi-sentence compression as a structured prediction task. Related sentences are represented by a word graph and every path in the graph is a (more or less meaningful) summary of the collection. We propose to adapt shortest path algorithms to the data at hand so that the shortest path realises the best possible summary of a collection of related sentences. We report on empirical results and compare our approach to state-of-the-art baselines using word graphs.

Tue. 25.03.14 Jan Stapel (BSc IMIT):

Mining Pattern Bitmaps for Time Series Anomaly Detection

Abstract:

Anomaly detection is a meaningful task in the field of time series analysis. Current algorithms for anomaly detection in time series define anomalies by use of domain-specific knowledge and it requires much effort by a domain expert to establish such definitions. Using explicit definitions, an anomaly is easily detected if a pattern with the defined property occurs in the time series. If domain-specific knowledge is not accessible, definitions of anomalies that are independent of a certain domain are needed. The present bachelor thesis examines an approach for anomaly detection, which is not based on domain-specific knowledge. This approach was first introduced by Wei et al. 2005, and is based on the search for anomalies by analysis of the time series according to the compound of patterns with a predefined size. Additionally, each pattern is visualized by a representative bitmap. An implementation of this approach and the analysis of its complexity in terms of time constitutes the main part of this thesis. A similar approach, which is also detecting patterns having an unusual compound of symbols, was introduced by Keogh et al. 2002, and is considered as a baseline. The results provided by this two approaches are compared in the evaluation part of this thesis.

Tue. 25.03.14 Lars Kuennemann (MSc IMIT):

Hyperparameter Optimierung mit Hilfe von Gauss Prozessen

Abstract:

Viele Machine Learning Methoden werden mit Hilfe von Hyperparametern konfiguriert, um bessere Ergebnisse zu erzielen. Diese Hyperparameter-Optimierung uebernehmen in der Regel Experten auf dem jeweiligen Fachgebiet oder laesst sich mit Brute-Force-Verfahren bestimmen, die allerdings eine sehr lange Zeit zur Bestimmung aller Genauigkeiten der jeweilig moeglichen Hyperparameterkombinationen benoetigen. In dieser Arbeit wird die Hyperparameter-Optimierung mit Hilfe der Grid-Suche, der Random-Suche und einem SMBO-Verfahren, dem Gauß-Prozess, vorgestellt und die Ergebnisqualitaet und den Aufwand der einzelnen Verfahren miteinander verglichen. Dabei wird im Detail auf das Vorgehen des Gauß-Prozess eingegangen und alle wesentlichen Bestandteile, wie die jeweils verwendete Kernel-Funktion und die sogenannte acquisition function, erlaeutert. Insgesamt werden drei verschiedene Arten von Kernel-Funktionen und vier verschiedene acquisition functions beschrieben und getestet.

Tue. 11.03.14 Michael Kessler (MSc IMIT):

An Empirical Survey of Image Feature Representations for Embedded Traffic Sign Recognition

Abstract:

The department CC-DA at Robert Bosch GmbH is currently developing the third generation of camera platforms for video-based driver assistance systems. Among the subsystems in development for that platform, the module RSR (Road Sign Recognition) is in charge of identifying and displaying sign related information to the driver. Continually increasing customer requirements with respect to sign coverage, recognition rates and runtime performance necessitate the analysis of alternative approaches. The proposed master thesis aims for the analysis of different feature representations of traffic signs and their influence on the classification performance. Observing the limitations of hardware resources constitutes a crucial factor in the selection of algorithms. One traditional family of representations is based on projecting data into a lower dimensionality representation, such that Principal Component Analysis (PCA), Discrete Cosine Transformation (DCT), or label-supervised decompositions such as Fisher's Discriminant Analysis (FDA). Another direction to be assessed is the bag-of-local-features where images are characterized as histograms of local patterns. Pioneering variants are scale-invariant representation (SIFT) and gradient histograms (HoG). Recent state of-the-art representations focus on variations of spatial-pyramids of local bag-of-features and sparse codings of local feature histograms. Aim of the thesis is the evaluation of the proposed methods for RSR regarding classification and runtime performance.

Tue. 18.02.14 Rodion Marx (MSc IMIT):

Personalisiertes Empfehlungssystem fuer Fahrzeugkonfiguratoren unter Verwendung eines Faktorisierungsmodells

Abstract:

Volkswagen setzte im Jahr 2012 rund 3,7 Millionen Fahrzeuge ab. Ein Grossteil davon sind Fahrzeuge, die direkt durch einen Endkunden bestellt und konfiguriert wurden. Der Rest sind sogenannten Lagerfahrzeuge. Diese muessen durch Haendler konfiguriert und bestellt werden, ohne dass eine konkrete Kundenbestellung dahintersteht. Die darueber hinaus existierende hohe Variantenvielfalt stellt das den Haendler vor eine komplexe Aufgabe. Er muss Fahrzeuge so konfigurieren, dass sie den Anspruechen von zukuenftigen Kunden genuegen. Dabei ist aus einer Vielzahl von Ausstattungsmerkmalen zu waehlen. Der State of the Art ist, dass sich die Haendler vollkommen auf ihre Erfahrung und Intuition verlassen muessen. Es mangelt an einem Empfehlungssystem zur Unterstuetzung der Haendler fuer zukuenftige Kunden attraktive Fahrzeuge zu konfigurieren. BRAUCH hat sich diesem Problem gestellt und in seiner Arbeit ein Empfehlungssystem entwickelt, dass eine Liste aus attraktiven Fahrzeugrundkonfiguration empfiehlt. Es handelt sich dabei lediglich um Grundkonfigurationen, die keinerlei Sonderausstattungen enthalten. Es bleibt weiterhin dem Haendler und seiner Intuition ueberlassen aus einer Vielzahl an Sonderausstattungen zu waehlen. Die vorliegende Arbeit widmet sich diesem Problem. Dazu wird ein Empfehlungssystem entwickelt, das den Haendler bei der Konfiguration der Sonderausstattungen, sogenannter Special Items, schrittweise unterstuetzt. Es werden dabei in jedem Konfigurationsstatus, nach Auswahl des Grundmodells, weitere attraktive Special Items empfohlen. Bis heute ist kein Empfehlungssystem bekannt, das in der Lage ist, Komponenten eines konfigurierbaren Produktes zu empfehlen. Dies stellt einen neuartigen Ansatz dar. Zur Realisierung dieses Ansatzes wird in dieser Arbeit, basierend auf dem Modell der Faktorisierungsmaschine und der Optimierungsfunktion Bayesian Personalized Ranking, ein neues Verfahren entwickelt. Dieses ist in der Lage aus Quelldaten zu lernen, die Produkte enthalten, welche selbst aus Komponenten bestehen. Daraus werden Empfehlungen generiert, die den Haendler beim Vervollstaendigen von teilkonfigurierten Produkten unterstuetzen.

Tue. 28.01.14 Christoph Herrmann (BSc WI):

Evaluierung von Heuristiken angewandt in der Bidirectional BFIDA*-Suche fuer Peg Solitaire

Abstract:

Der Vortrag behandelt die Untersuchung der Effizienzen verschiedener Heuristiken angewandt auf das Brettspiel Peg Solitaire. Die Ergebnisse liefert dabei der Suchalgorthmus Bidirectional BFIDA*. Es wird zuerst kurz erlaeutert, wie sich die drei Einzelteile des Algorithmus (Breitensuche, IDA*, Bidirektionale Suche) zusammensetzen lassen. Anschließend wird auf das Brettspiel Peg Solitaire eingegangen, um kurz das Spiel und alle suchrelevanten Eigenschaften aufzuzeigen. Im Anschluss wird die Anwendung der Bidirektionalen BFIDA*-Suche auf Peg Solitaire beschrieben. Es folgen die durchgefuehrten Experimente und deren Auswertung fuer drei verschieden Formen des Spielbrettes. Abgeschlossen wird der Vortrag mit einem Fazit und Ausblick.

Tue. 17.09.13 Jan Stapel (BSc IMIT):

Mining Pattern Bitmaps for Time Series Anomaly Detection

Abstract:

Wherever a natural or technological process needs to be observed, sensors are applied to submit real valued measurements which are indicating its status at a certain time. Many such recordings, denoted as time-series, contain abnormal patterns. However, since a domain expert is an expensive resource, automatic approaches are needed to find anomalies in those time series. The aim of this thesis is to review two comparable algorithms for anomaly detection in time series. This include the implementation and evaluation of the both methods. In this talk the first results of the thesis will be presented.

Tue. 10.09.13 Martin Wistuba (ISMLL, Uni Hildesheim):

Move Prediction in Go - Modeling Feature Interactions Using Latent Factors

Abstract:

Move prediction systems have always been part of strong Go programs. Recent research has revealed that taking interactions between features into account improves the performance of move predictions. In this paper, a factorization model is applied and a supervised learning algorithm, Latent Factor Ranking (LFR), which enables to consider these interactions, is introduced. Its superiority will be demonstrated in comparison to other state-of-the-art Go move predictors. LFR improves accuracy by 3% over current state-of-the-art Go move predictors on average and by 5% in the middle- and endgame of a game. Depending on the dimensionality of the shared, latent factor vector, an overall accuracy of over 41% is achieved.

Contact person: Prof. Dr. Dr. Lars Schmidt-Thieme

Location & Time:
Time:	Mon 10-12
Location:	B26/C202