
Die in vielen Anwendungsgebieten stark angewachsenen Datenmengen machen eine manuelle Analyse der angefallenen Information zunehmend schwierig, wenn nicht sogar unmöglich. Gerade in Bereichen wie der Auswertung biologischer Meßverfahren (Gen-Sequenzierung, Micro-Array Verfahren ...) oder von Transaktionsdaten großer Telekomunikations- oder Netzbetreiber, ist eine Nutzung der Daten ohne die Zuhilfenahme computergestützter Verfahren nicht denkbar.
Mit der Lösung dieser Probleme beschäftigt sich daher das vergleichsweise junge Forschungsgebiet "Knowledge Discovery in Databases (KDD)". Es verbindet dabei Aspekte der Statistik, des maschinellen Lernens, sowie der Datenbanksysteme und behandelt Methoden zur (semi-)automatischen Extraktion von gültigem, neuem und potentiell nützlichem Wissen aus großen Datenbanken. Der in diesem Zusammenhang häufig verwendete Begriff Data Mining bezieht sich dabei auf den grundlegenden Schritt im KDD-Prozess, in dem die eigentliche Analyse der Daten durchgeführt wird.
Während die Vorlesung den Schwerpunkt auf den Data Mining Schritt setzt, widmet sich das Praktikum dem gesamten KDD-Prozess. Anhand von konkreten Problemstellungen werden die Teilnehmer verschiedenste Werkzeuge der (semi-)automatischen Wissensextraktion aus großen Datenmengen kennen und einsetzen lernen.
Neben einem abgeschlossenen Vordiplom ist der Erwerb eines Scheines in der Vorlesung "Knowledge Discovery in Databases" Voraussetzung. Des Weiteren ist es hilfreich, über Kenntnisse aus den Vorlesungen "Index- und Speicherungsstrukturen für Datenbanksysteme", "Maschinelles Lernen" sowie "Datenbanksysteme I" zu verfügen.
| Veranstaltung | Zeit | Ort | Beginn |
|---|
Data Mining Software:
Java: