Seminar: Aktuelle Trends in der Künstlichen Intelligenz
F. Puppe, J. Krebs und die Mitarbeiter/-innen des Lehrstuhls VI
Im Sommersemester 2020 werden allgemeine Themen aus der Künstlichen Intelligenz vergeben. Mögliche Schwerpunkte sind unter anderem Natural Langugage Processing, Bildverarbeitung und Reinforcement Learning. Ziel des Seminar ist es, selbstständig ein Thema anhand geeigneter Literatur zu erarbeiten und dieses sowohl in einem mündlichen Vortrag, als auch einer schriftlichen Ausarbeitung zu präsentieren.
UPDATE: Aufgrund der Corona-Krise kann der mündliche Vortrag in Form einer Skype-Konferenz abgenommen werden. Sollte bis Ende des Semesters weiterhin von Präsenzveranstaltungen abgesehen werden, werden zu diesem Zwecke Einzeltermine mit dem jeweiligen Prüfling vereinbart. Eine weitere denkbare Möglichkeit ist es, den Vortrag als Video mit Audiokommentar vorzubereiten, dieses dann abzugeben und sich lediglich den Fragen der Prüfer in einer Skype-Konferenz zu stellen. Das genaue Prozedere wird abhängig von der jeweiligen Situation Ende des Semesters rechtzeitig bekannt gegeben. Die schriftlichen Ausarbeitungen bleiben davon unberührt. BITTE AUCH DAS UPDATE ZUR EINFÜHRUNGSVERANSTALTUNG WEITER UNTEN BEACHTEN!
UPDATE 08.04.2020: Es sind alle Themen für das SS2020 vergeben. Alle die kein Thema bekommen haben (auch nicht an anderen Lehrstühlen) und weiter auf der Warteliste bleiben wollen, sollen bitte wie bereits unten angekündigt ihren Platz "refreshen". Das ist nötig, damit wir mitkriegen, wer kein Interesse mehr hat und so für die Verbleibenden verlässlichere Abschätzungen abgeben können. Die Frist zum "refreshen" endet am 31.05.2020, so dass ausreichend Zeit ist, um klären zu können, ob man anders wo ein Thema noch dieses Semester bekommen kann. Also bitte nur bei ernsthaftem Interesse Bescheid geben, nicht Wartelistenplätze hamstern ;-) . Neuanmeldungen sind natürlich ebenfalls weiterhin möglich.
Das Seminar eignet sich für Studierende im Bachelor- und im Masterstudium.
Es werden dieses Semester sowohl Einzelthemen, als auch Doppelthemen (zwei Bearbeiter im Team, doppelter Umfang) vergeben, um die Zahl der möglichen Seminarplätze zu erhöhen. Zweiterteams, die sich als solche anmelden werden für die Doppelthemen bevorzugt. Können nicht alle Doppelthemen von vornherein vergeben werden, wird mit Teilnehmern aus den Einzelanmeldungen aufgefüllt.
Anmeldung: ACHTUNG NEU!!! Wir haben das Anmeldesystem auf eine globale, semesterübergreifende Warteliste umgestellt. Das heisst, wenn Sie Interesse haben am Seminar teilzunehmen, schreiben Sie eine Mail mit vollem Namen, Matrikelnummer und Studiengang an untenstehenden Kontakt. Sie werden dann in die Warteliste aufgenommen. Die Aufnahme in die Warteliste kann zu jedem Zeitpunkt erfolgen, einen expliziten Anmeldezeitraum gibt es nicht, da die Themen sowie in Anmeldereihenfolge vergeben werden. Es gibt für Doppel- und Einzelthemen separate Wartelisten, da wir für Doppelthemen Teams bevorzugen (weil das aus Erfahrung besser funktioniert). Finden sich nicht genug vorangemeldete Teams, füllen wir nach Vergabe der Einzelthemen aus der Einzelthemen-Warteliste auf. Man kann sich nur für eine Warteliste eintragen lassen.
Regeln zur Warteliste: Die Themen werden in der Einführungsveranstaltung der Reihe nach an die Führenden der Warteliste vergeben. Wer nicht anwesend ist, bekommt kein Thema und verliert auch seinen Platz in der Warteliste. Wem die Themen nicht zusagen und freiwillig zurücktritt, verliert seinen Listenplatz ebenfalls. Die Themen werden solange in Reihenfolge weiter vergeben, bis das letzte Thema vergeben ist. Alle Teilnehmer, bis zu diesem Platz, werden aus der Liste gelöscht und diejenigen, die kein Thema bekommen haben rücken nach vorne auf. Es ist weiterhin nötig, nach jeder Einführungsveranstaltung seine Anmeldung zu erneuern um seinen Platz nicht zu verlieren, damit wir mitbekommen, ob die Teilnehmer vielleicht zwischenzeitlich ein anderes Seminar belegt haben (so können wir für die Interessierten bessere Prognosen abgeben ob es im nächsten Semester funktionieren wird, oder nicht). Die Erneuerungen für das WS 2020 müssen bis zum 31.05.2020 eingehen.
Themenbekanntgabe: Um den Leuten den Weg zu ersparen, die zwar nach Liste ein Thema bekommen würden, aber denen die jeweiligen Themen des Semesters nicht gefallen, werden die Themen bereits ca. eine Woche (falls früher final festgelegt, dann auch früher) vor der Einführungsveranstaltung auf dieser Webseite bekannt gegeben. Sollte jemand schon vorher wissen, dass er doch nicht kommt, bitten wir ebenfalls um (verbindliche!) Mitteilung, so können wir ebenfalls bekannt geben, bis zu welcher Platznummer wir voraussichtlich Themen vergeben werden. Die eigene aktuelle Platznummer kann jederzeit bei untenstehendem Kontakt erfragt werden.
Sollten in der Einführungsveranstaltung nicht alle Themen vergeben werden können, oder jemand sein Thema noch während der ersten 10 Tage nach Vergabe zurückgeben, werden wir diese hier auf der Homepage nochmals ausschreiben. Die Themen können dann noch im laufenden Semester bearbeitet werden. Diese Themen werden innerhalb des ersten Tages nach Neuausschreibung in Reihenfolge der Warteliste vergeben, danach nach dem Prinzip "first come, first serve".
Einführungsveranstaltung: ACHTUNG! NEU! Da aufgrund der Corona-Krise von Präsenzveranstaltungen aktuell weitestgehend abzusehen ist, findet in diesem Semester keine Einführungsveranstaltung statt. Die Themen werden dieses Semester ausschließlich online per E-Mail vergeben. Folgender Ablauf: Jeder Teilnehmer in der Warteliste bekommt der Reihe nach eine E-Mail mit den aktuell noch verfügbaren Themen aus denen er sich dann binnen 6 Stunden eines Auswählen kann. Sollte innerhalb der 6 Stunden keine Antwort erfolgen, ist der Listenplatz verloren und die Themen werden dem Nächsten in der Warteliste angeboten. Die Mails werden ab kommenden Montag, 06.04.2020 verschickt. Damit niemand die ganze Nacht seine Mails checken muss, werden die Mails nur zwischen 9 Uhr morgens und 18 Uhr am Abend verschickt. Es wäre schön, wenn Sie sich schnell für ein Thema entscheiden könnten, damit sich das ganze nicht unnötig in die Länge zieht. Die Themen werden ebenfalls ab spätestens Montag 06.04.2020 hier auf der Homepage mit einer kurzen Beschreibung zur leichteren Entscheidungsfindung bekannt gegeben.
Kontakt: Für Anmeldungen und Rückfragen steht Jonathan Krebs (jonathan.krebs@uni-wuerzburg.de) per Mail zur Verfügung.
Themen im Sommersemester 2020
Einzelthemen
1. Markov Logic Networks
Ziel dieses Themas ist die Vorstellung von Markov Logic und Markov Logic Networks. Die besondere Stärke dieser Sonderform von Logic ist die Kombination von First-Order Logic mit Grafischen Modellen (und somit mit Wahrscheinlichkeitstheorie). Dies ermöglcht die Modellierung von harten-constraints, sowie von Softconstraints. Das Framework ist zudem in der Lage (über Belief-propagation) automatisch Gewichtungen für Logische Aussagen zu lernen. Es wird erwartet, dass der Zuhörer nach der Vorstellung des Themas in der Lage ist, Markov Logic auf eine konkrete Problemstellung anzuwenden, und eine Grundidee davon haben, wie die Gewichte gelernt werden und die Inferenz von neuen Problemen von Statten geht. - Betreuer: Markus Krug
2. Information Extraction from Scientific Papers
Ziel dieses Themas ist die Darstellung der bisherigen Arbeiten zur automatischen Informationsextraktion aus wissenschaftlichen Papern. Also es geht konkret darum, welche Art von Informationen wurde mit welchen
Techniken auf welchen Datensätzen mit welcher Qualität extrahiert, und was ist die Grundlegen Motivation hinter diesen Bemühungen (z.B. Erstellung eines Zitationsnetzwerkes). Die angegebene Quelle dient lediglich als Einstieg und ist nicht als allumfassende Ressource zu betrachten. - Betreuer: Markus Krug
3. Compressive Transformers for Long-Range Sequence Modelling
Ziel dieses Thema ist, sowohl das Konzept "Transformer", als auch des "Compressive Transformers" vorzustellen und dabei die Unterschiede und Vorteile des einen gegenüber des anderen heraus zu arbeiten. - Betreuer: Jonathan Krebs
4. Coreference Resolution as Query-based Span Prediction
Ziel dieses Themas ist die Vorstellung eines Ansatzes zur Koreferenzauflösung mittels "Span prediction". Koreferenzauflösung hat das Ziel alle Referenzen eines Textes (z.B. Pronomen, oder andere Phrasen) der passenden Entität zuzuordnen. In diesem Paper werden moderne Neuronale Sprachmodelle genutzt, um dieses Task über ein Frage-Antwortspiel zu lösen. - Betreuer: David Schmidt
5. Real-time Object Detection
Ziel des Themas ist es das Paper Objects as Points (https://arxiv.org/pdf/1904.07850.pdf) vollständig zu verstehen und das zugehörige Repository (https://github.com/xingyizhou/CenterNet) auf eigenen Daten (hierzu werden Daten vom Lehrstuhl bereitgestellt) anzuwenden. CenterNet ist der state of the art der Echtzeitobjekterkennung. In dem Paper wird ein Objekt als einen einzigen Punkt (anstatt 4 Koordinaten), den Mittelpunkt seines Begrenzungsrahmens definiert. - Betreuer: Adrian Krenzer
6. State-of-the-art Action Recognition
Ziel des Themas ist einen Überblick über den state of the art Aktionserkennung zu geben. Hierbei soll vor allem auf Ansätze mit 3D CNN eingegangen werden. Wichtig sind außerdem die Übertragbarkeit und Anwendung der Ansätze in verwandten Gebieten wie Objekt Erkennung. Wünschenswert ist eine kleine Demonstration des Ansatzes erläutert in dem Paper Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset (http://openaccess.thecvf.com/content_cvpr_2017/papers/Carreira_Quo_Vadis_Action_CVPR_2017_paper.pdf) - Betreuer: Adrian Krenzer
7. A Two-Stage Method for Text Line Detection in Historical Documents
Grüning et. al stellen einen zweistufigen Ansatz zur Erkennung von Textbereichen für historische Dokumente vor. Der Ansatz beruht auf sogenannten Baselines. Das Annotieren einer Textzeile mit einer Baseline kann als Unterstreichen der Zeile aufgefasst werden. Damit wird eine Textzeile mit einer enganliegenden Linie (Unterstrich) markiert. Der Ansatz nutzt in der ersten Phase ein Neuronales Netz um Pixel im Bild zu bestimmen, die zu einer Baseline vermutlich dazugehören. Im zweiten Schritt wird die Vorhersage des Neuronalen Netzes anhand von Superpixeln und Clusterverfahren zu Baselines weiterverabeitet. - Betreuer: Alexander Hartelt
8. EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks
Convolutional Neuronale Netzwerke werden für gewöhnlich anhand eines eingeschränkten Budgets entwickelt. Anschließend werden diese in der Tiefe skaliert, indem beispielsweise weitere Layer hinzugefügt werden, um die Genauigkeit solcher Netze noch weiter zu verbessern. Mingxing Tan et. al stellen eine neue Methodik vor, die bei der Skalierung solcher Netze neben der "Tiefe" ebenfalls dessen "Breite" und die Auflösung der Eingabedaten (Bilder) miteinbezieht. Bei der Studie, die dabei einherging, wurde eine neues Basline Netzwerk entwickelt, welches deutlich bessere Genauigkeiten und Geschwindigkeiten als vorherige CNNs aufweist, obwohl dieses 8.4x kleiner und 6.1x schneller als das bisher beste ConvNet ist. (Evaluiert auf ImangeNet Datensatz) - Betreuer: Alexander Hartelt
Doppelthemen
1. ULMFit & MultiFiT
Ziel dieses Doppelthemas ist die Vorstellung von den beiden Neuronalen Sprachmodellen ULMFit und MultiFit. Letzteres kann als Nachfolger von ULMFit verstanden werden. Was beide im Kern haben, ist die Modellierung von Texten mittesl Rekursiven Neuronalen Netzen. Ziel ist es diese Modelle aufzuarbeiten, deren Stärken und Schwächen herauszuarbeiten, und mit bestehenden Transformerbasierten Architekturen zu vergleichen - Betreuer: David Schmidt
2. Polyp Classification
Ziel des Doppelthemas ist ausgehend von der Übersicht (https://drive.google.com/file/d/1ZuSQXaemOchFUU5iEMbpdp9yrtad_uVu/view?usp=sharing) eine Literanalyse über das Thema Polypenerkennung zu erstellen. Hierbei soll eine Tabelle erarbeitet werden, welche verschiede Eigenschaften der Publikationen aufzeigt und den Nutzen bei Erkennung von Polypen erläutert. - Betreuer: Adrian Krenzer
3. Herausforderungen und Ansätze in der automatisierten medizinischen Befundung
Ziel des Themas ist es, aus den gegebenen Quellen die Herausforderungen bei der Umsetzung der automatisierten medizinischen Befundung zu erfassen und darzustellen, sowie ausgewählte Implementierungen näher zu erklären. Für letzteres stehen mehrere Quellen zur Auswahl, wobei weitere gerne dazu genommen werden können. - Betreuer: Amar Hekalo
4. Text Summarization - An Overview
Ziel ist es, anhand geeigneter, aktueller Literatur verschiedene Methoden zur automatischen Zusammenfassung von Freitexten vorzustellen. Dabei sollen insbesondere auch übliche Evaluationsmetriken vorgestellt und erklärt werden. - Betreuer: Jonathan Krebs