Information Retrieval
In dieser Vorlesung geht es um Algorithmen und Methoden, wie sie etwa bei Suchmaschinen wie Google und Bing zur Anwendung kommen. Allgemein versteht man unter Information Retrieval das Aufbereiten und Finden von Informationen, wobei man dies häufig auf das Finden von Dokumenten mit relevanten Inhalten beschränkt. In der Vorlesung werden neben den inhaltlichen Konzepten, die hinter bekannten Suchmaschinen wie z.B. Google stehen, auch Ideen der effizienten Implementierung solcher Systeme eingeführt. Dabei wird auch mit Konzepten wie MapReduce und deren Implementierungen Apache Hadoop oder Apache Spark zur Analyse von Big Data auf verteilten Rechenclustern gearbeitet. Insgesamt werden unter anderem folgende Themen behandelt:
- Boolesches und Vektorraum-Retrieval-Modelle
- Elementares Tokenizing, Indexing, und die Implementierung von vektorraumbasiertem Retrieval
- Performanz-Bewertung von Retrieval-Systemen
- Anfrage-Operationen (Relevance Feedback, Anfrageerweiterung)
- Anfragesprachen und –paradigmen
- Strukturelle Anfragen
- Texteigenschaften
- Web-Suche: Einführung, Crawling, Interfaces, Link-Analyse
- Implementierung von PageRank (Google Ranking) mit Apache Spark
Organisatorisches
Bitte Beachten:
Aufgrund der aktuellen Umstände wird die Vorlesung Information Retrieval auf Online-Lehre umgestellt.
Sie finden alle aktuellen Informationen der Veranstaltung auf WueCampus2.
Bitte schreiben Sie sich über den obigen Link frühzeitig in WueCampus2 ein, um Zugriff auf den Kurs, aber auch E-Mails mit wichtigen Ankündigungen erhalten zu können.
- Vorlesung
Im Sommersemester 2020 werden keine Vorlesungen für Information Retrieval stattfinden.
Stattdessen wird entsprechendes Material zum Selbststudium im WueCampus-Kurs angeboten. Es wird am 21.04.2020 um 10:15 Uhr eine Erstveranstaltung über ZOOM geben, bei der alle wichtigen organisatorischen Informationen für den Ablauf des Semesters erläutert werden. Links zur Teilnahme an dem ZOOM Meeting werden rechtzeitig in WueCampus2 bereitgestellt. Bitte stellen Sie sicher dass ZOOM auf Ihrem System funktioniert (siehe unten), damit Sie ohne Probleme daran teilnehmen können. - Übungen
Do, 8:15 - 9:45
Do, 10:15 - 11:45
Der Übungsbetrieb wird über ZOOM stattfinden. Bitte stellen Sie für eine bessere Betreuung sicher, dass Sie eine Kamera zur Verfügung haben (ggf. über Handy). Das genaue Übungsformat wird wie gehabt während der Erstveranstaltung bekanntgegeben. - Prüfung
Es wird am Ende des Semesters eine Prüfung stattfinden. Form, Ablauf und genauer Zeitpunkt müssen allerdings noch erarbeitet werden, und werden baldmöglichst über WueCampus2 bekannt gegeben. - ZOOM
ZOOM benötigt einen vorinstallierten Client. Ein Account wird zur Teilnahme allerdings nicht benötigt. ZOOM ist außerdem auch auf Android und IOS verfügbar.
(ZOOM funktioniert auch im Browser. Diese Variante können wir aber aufgrund der schlechteren Performance nicht empfehlen.) - Aktuelle Details werden im Ankündigungsforum des WueCampus2 Kurses geteilt.
Bleiben Sie gesund!
Literatur
- Introduction to Information Retrieval.
Christopher D. Manning and Prabhakar Raghavan and Hinrich Schütze.
Cambridge University Press, 2008. - Modern Information Retrieval.
Ricardo A. Baeza-Yates and Berthier A. Ribeiro-Neto.
ACM Press / Addison-Wesley, 1999. - Information Retrieval: Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web.
Reginald Ferber.
dpunkt Verlag,Heidelberg, 2003.