Lehr- und Forschungseinheit für Datenbanksysteme Ludwig-Maximilians-Universität München
Institut für Informatik, LFE Datenbanksysteme
Prof. Dr. Hans-Peter Kriegel
University of Munich
Institute for Computer Science
Database and Information Systems

Clustering Projekt- und Diplomarbeiten:
Clustering und Outlier Detection

Schwerpunkt

Cluster Analyse ist ein wichtiger Teilbereich des Data Mining. Sie kann entweder als eigenstädige Methode verwendet werden, um neue Einsichten in den Datensatz zu gewinnen, z.B. um das Potential anderer Datenanalyse oder -Verarbeitungsschritte zu evaluieren, oder als ein Vorverarbeitungsschritt für andere Data Mining Verfahren angewendet werden, die auf den entdeckten Clustern arbeiten. Dichtebasierte Verfahren wenden ein lokales Cluster Kriterium an. Cluster sind definiert als Bereiche im Datenraum, in denen die Objekte dicht beieinander liegen, und die durch Gebiete geringer Dichte voneinander getrennt sind (sog. Rauschen). Diese dichten Regionen oder Cluster können beliebig geformt sein und die Datenobjekte in ihnen können beliebig verteilt sein.
Für andere KDD Anwendung, z.B. das Entdecken krimineller Handlungen im E-Commerce, ist es wichtiger, Ausreißer (Outlier), d.h. seltene Beobeachtungen, zu finden.

Arbeitsgebiete

Ausführlichere Informationen gibt es auf unserer Projektseite.

Werkzeuge

  • Programmiersprachen: Java, Perl, C, C++
  • Datenbanksystem: Oracle8i
  • Schnittstellen: JDBC, SQLJ, Java Stored Procedures
  • Visualisierung: Java, Java3D

  • Kontakt

    In diesem Projekt sind laufend Projekt- und Diplomarbeiten zu vergeben. Interessierte Studentinnen und Studenten melden sich bitte bei:

    Bisherige Arbeiten


    Homepages: DBSInstitutLMU
    Markus Breunig (breunig@informatik.uni-muenchen.de), 15.07.99