Praktikum: Natural Language Processing
Veranstalter: Prof. Dr. Andreas Hotho, Albin Zehe, Alexander Dallmann
Umfang: 5 ECTS
Kurzbezeichnung: 10-I=PRJAK
WueCampus-Kurs: Link
Einführungsveranstaltung: 14.11.2019, 11:30 im Besprechungsraum von LS 6 (B002).
Konzept des Praktikums
In diesem Master-Praktikum werden sich die Studierenden mit den Methoden des Natural Language Processing (NLP) beschäftigen. Dabei arbeiten sie in Kleingruppen an großen Text-Datensätzen aus dem Internet, um damit ein Modell zur Klassifikation von wissenschaftlichen Publikationen zu entwickeln. Die Kleingruppen bearbeiten dabei dieselbe Fragestellung. Am Ende des Semesters werden die unterschiedlichen Ansätze und Lösungen vorgestellt und auf einem Test-Datensatz evaluiert.
Im Zentrum dieses Praktikums steht das Erlernen von NLP-Methoden und das wissenschaftlich fundierte Entwickeln von kreativen neuen Ansätzen, um das gesetzte Ziel zu erreichen.
Ablauf des Praktikums
In der Bearbeitung der gegebenen Fragestellung innerhalb dieses Praktikums sind die Studierenden sehr frei. Treffen in der Großgruppe sind für alle Teilnehmer im Zwei-Wochen-Rhythmus angesetzt. Bei diesen Treffen werden Zwischenstände präsentiert (evtl. mit kurzen Präsentationen), Fragen geklärt und Probleme diskutiert.
Am Ende des Semesters sollte jede Kleingruppe ein funktionierendes System vorweisen können, welches auf einem vorher nicht bekannten Test-Datensatz evaluiert wird. Bei einem gut funktionierenden System ist die Umsetzung als Web-App angedacht, um die gewonnenen Ergebnisse anderen Wissenschaftlern zur Verfügung zu stellen.
In diesem Semester wird im Rahmen des Praktikums ein Task des SemEval-Workshops bearbeitet:
Assessing the Funniness of Edited News Headlines (SemEval 2020 Task 7).
Die Gruppe mit dem besten Ergebnis erhält am Ende des Semesters die Möglichkeit, in Zusammenarbeit mit den Betreuern ein Paper zum SemEval einzureichen und damit bereits früh eine erste wissenschaftliche Publikation zu erreichen. Das Einreichen des Papers geschieht auf rein freiwilliger Basis und ist unabhängig von der Lehrveranstaltung und der Note.
Leistungsnachweis
Am Ende des Semesters stellt jede Gruppe ihren Ansatz in einer 15-30 Minuten langen Präsentation vor. Außerdem ist ein Praktikumsbericht im Umfang von 10-15 Seiten abzugeben.