Lehr- und Forschungseinheit für Datenbanksysteme
Datenbanksysteme
Database Systems

Projekt/Diplomarbeiten im Bereich:

Fokusiertes Website-Crawling

Fokusierte Webcrawler sind Programme, die das World Wide Web durch sukzessives Verfolgen von Hyperlinks nach vorgegebenen Inhalten durchsuchen. Die Erkennung dieser Inhalte funktioniert dabei durch Methoden des maschinellen Lernens.  Bisherige Methoden des fokusierten Crawlings waren  auf  das Finden einzelner relevanter HTML-Dokumente beschränkt. Der in Kooperation mit der Simon Fraser University in Vancouver (Kanada) entwickelte Focused Website-Crawler, sucht dagegen gezielt nach themenspezifischen Internetdomänen. D.h. Ziel der Suche ist die Entdeckung von Domänen, die z.B. zu bestimmten Firmen oder anderen Organisationen gehören.




Mögliche Themen

Vorkenntnisse

Ansprechpartner

Matthias Schubert Raum : E 1.04
Telefon :  089 / 2180 9321
Mail : schubert@dbs.informatik.uni-muenchen.de
Homepages: home DBShome Instituthome LMU
14.8.01 Matthias Schubert