DBS-Logo Ludwig-Maximilians-Universität München
Institut für Informatik, LFE Datenbanksysteme 
 
University of Munich
Institute for Computer Science
Database and Information Systems 

Wrapper-Generierung

zur Datenextraktion von Webseiten


Beschreibung:
 

Das WWW enthält eine Vielzahl von nützlichen Informationen. Leider ist es nicht möglich die Informationen automatisch miteinander zu verknüpfen und somit in einen Kontext zu bringen. Nützlich wäre es z.B. für einen Benutzer, der sich für ein bestimmtes Buch interessiert, wenn Informationen von verschiedenen (Internet-)Buchhändlern angefordert und verknüpft werden könnten. Leider liegen diese Daten meist nicht in Rohform vor, sondern werden zur besseren Lesbarkeit für den Nutzer um Layout-Daten ergänzt. Dies macht es schwierig für den Computer automatisch zu entscheiden welche Informationen aus  dieser Quelle zu extrahieren sind. Ziel ist es nun, dieses Prozeß der Datenextraktion durch ein Anwendungsprogramm zu realisieren. Dabei soll der Benutzer möglichst wenig involviert werden, die Hauptlast soll der generierte Wrapper tragen.




Bearbeiter(in)

Titel                     

Bearbeitungszeitraum

Christian Zimmer und Lars Tamcke

Wrapper-Generierung

zur Datenextraktion von Webseiten

 1.7.2002 - 30.9.2002


Qualifikation:

Vorlesung "Verteilte- und Förderierte Datenbanken" empfehlenswert. Für die Implementierung soll JAVA verwendet werden.


Ansprechpartner:

Ameed Sahaka, Zi. E 1.62, Tel. +49-89-2180-9196, email: sahaka@dbs.informatik.uni-muenchen.de