Deutsch Intern
    Data Science Chair

    Seminar: Musik und Maschinelles Lernen

    Veranstalter: Prof. Dr. Andreas Hotho, Daniel Schlör, Padraig Davidson

    Dieses Seminar wird begleitend bzw. vorbereitend zum gleichnamigen Master-Praktikum angeboten. Ziel des Seminars ist gemeinsam die theoretischen Grundlagen zur Anwendung von Machine Learning auf ausgewählte musikalische Fragestellungen zu erarbeiten. Rundimentäres Grundwissen zu digitaler Musik (beispielsweise zum MIDI Format) bzw. zu Musik allgemein (was sind Noten und Notenwerte) bzw. das Interesse sich dieses anzueignen sowie Vorwissen aus dem Bereich Data Mining und Neuronale Netze sind empfehlenswert. Das Seminar richtet sich eher an Studierende im Master Informatik, kann aber auch im Bachelor besucht werden sofern Sie motiviert sind sich ggf. einzuarbeiten.

    Bei Fragen oder zur Reservierung eines Themas/Platzes schreiben Sie bitte eine Email an Daniel Schlör.
    Geben Sie dabei bitte immer den Studiengang und die Matrikelnummer mit an und ob Sie bereits verwandte Veranstaltungen wie beispielsweise Data Mining gehört oder anderweitig Vorwissen haben.

    Im Unterschied zum Seminar Ausgewählte Themen des Machine Learning liegt der Fokus in diesem Seminar auf der praktischen Umsetzbarkeit der behandelten wissenschaftlichen Arbeiten. Das Seminar besteht entsprechend aus zwei Teilen: Im ersten Teil soll jedes vergebene Seminarthema didaktisch aufbereitet präsentiert werden. Die Seminargruppe diskutiert dann über die technische Umsetzung und mögliche Anwendungen. Der zweite Teil besteht aus der Ausarbeitung der Hausarbeit, in der die theoretischen Grundlagen in eigenen Worten wiedergegeben und diese auf ein zuvor vereinbartes Anwendungsbeispiel übertragen werden sollen.

    Die Vorbesprechung wird über folgendes Zoom Meeting am 04.11.2020, 13:00 Uhr stattfinden:

    https://uni-wuerzburg.zoom.us/j/97729255265?pwd=VnlKWmNENW1aVkFhQnlDb1hnbmltQT09

    Corona News

    Aufgrund der aktuellen Umstände wird das Seminar auf Online-Lehre umgestellt.
    Nach der Erstbesprechung werden wir die Themen fest an Studenten vergeben. Themen bzw. Plätze können zuvor reserviert werden (siehe oben).

    Alle Besprechungen und Vorträge werden nach aktuellem Stand über ZOOM veranstaltet. Wir bitten um eine funktionierende Kamera. 

    ZOOM
    ZOOM benötigt einen vorinstallierten Client, der unter https://zoom.us/download verfügbar ist. Ein Account wird zur Teilnahme allerdings nicht benötigt. ZOOM ist außerdem auch auf Android und IOS verfügbar.
    (ZOOM funktioniert auch im Browser. Diese Variante können wir aber aufgrund der schlechteren Performance nicht empfehlen.)

    Themenvergabe und Vorbesprechung

    Themen können schon vor dem Vorbesprechungstermin reserviert werden. Die Themen werden einige Zeit vor der Vorbesprechung hier auf dieser Seite bekannt gegeben.

    Bei der Vorbesprechung werden die Themen - so nicht schon vergeben - an die anwesenden Seminarteilnehmer verteilt. Grundsätzlich besteht Anwesenheitspflicht. Teilnehmer, die bereits ein Thema bearbeiten, aber ohne Absprache fehlen, verlieren den Anspruch auf ihr Thema/ihren Platz

    Themen

    Die Grundlage zu den Vorträgen bilden wissenschaftliche Aufsätze (Papers). Jedes hier aufgeführte Paper entspricht einem Thema.

    Bei der Erstbesprechung werden übrige bzw. wieder frei gewordene Themen an anwesende Studenten verteilt. Wer möchte kann sich dafür auch auf eine Warteliste eintragen lassen (Anwesenheit trotzdem erforderlich). 

    Themen

    • Learning Style-Aware Symbolic Music Representations by Adversarial Autoencoders. Valenti, Andrea; Carta, Antonio; Bacciu, Davide. In ECAI, Vol. 325 of Frontiers in Artificial Intelligence and Applications, G. D. Giacomo, A. Catalá, B. Dilkina, M. Milano, S. Barro, A. Bugarín, J. Lang (eds.), pp. 1563–1570. IOS Press, 2020.
    • PiRhDy: Learning Pitch-, Rhythm-, and Dynamics-aware Embeddings for Symbolic Music. Liang, Hongru; Lei, Wenqiang; Chan, Paul Yaozhu; Yang, Zhenglu; Sun, Maosong; Chua, Tat-Seng. In ACM Multimedia, C. W. Chen, R. Cucchiara, X.-S. Hua, G.-J. Qi, E. Ricci, Z. Zhang, R. Zimmermann (eds.), pp. 574–582. ACM, 2020.
    • MIDI-Sandwich2: RNN-based Hierarchical Multi-modal Fusion Generation VAE networks for multi-track symbolic music generation. Liang, Xia; Wu, Junmin; Cao, Jing. In CoRR, abs/1909.03522. 2019.
    • LakhNES: Improving multi-instrumental music generation with cross-domain pre-training. Donahue, Chris; Mao, Huanru Henry; Li, Yiting Ethan; Cottrell, Garrison W.; McAuley, Julian J. In CoRR, abs/1907.04868. 2019.
    • Music Transformer: Generating Music with Long-Term Structure. Huang, Cheng-Zhi Anna; Vaswani, Ashish; Uszkoreit, Jakob; Simon, Ian; Hawthorne, Curtis; Shazeer, Noam; Dai, Andrew M.; Hoffman, Matthew D.; Dinculescu, Monica; Eck, Douglas. In ICLR (Poster). OpenReview.net, 2019.
    • Graph Neural Network for Music Score Data and Modeling Expressive Piano Performance. Jeong, Dasaem; Kwon, Taegyun; Kim, Yoojin; Nam, Juhan. In ICML, Vol. 97 of Proceedings of Machine Learning Research, K. Chaudhuri, R. Salakhutdinov (eds.), pp. 3060–3070. PMLR, 2019.
    • Encoding Musical Style with Transformer Autoencoders. Choi, Kristy; Hawthorne, Curtis; Simon, Ian; Dinculescu, Monica; Engel, Jesse H. In CoRR, abs/1912.05537. 2019.
    • Harmony Transformer: Incorporating Chord Segmentation into Harmony Recognition. Chen, Tsung-Ping; Su, Li. In ISMIR, A. Flexer, G. Peeters, J. Urbano, A. Volk (eds.), pp. 259–267. 2019.
    • Symbolic Music Genre Transfer with CycleGAN. Brunner, Gino; Wang, Yuyi; Wattenhofer, Roger; Zhao, Sumu. In ICTAI, L. H. Tsoukalas, Éric Grégoire, M. Alamaniotis (eds.), pp. 786–793. IEEE, 2018.
    • MuseGAN: Multi-track Sequential Generative Adversarial Networks for Symbolic Music Generation and Accompaniment. Dong, Hao-Wen; Hsiao, Wen-Yi; Yang, Li-Chia; Yang, Yi-Hsuan. In AAAI, S. A. McIlraith, K. Q. Weinberger (eds.), pp. 34–41. AAAI Press, 2018.
    • DeepBach: a Steerable Model for Bach Chorales Generation. Hadjeres, Gaëtan; Pachet, François; Nielsen, Frank. In ICML, Vol. 70 of Proceedings of Machine Learning Research, D. Precup, Y. W. Teh (eds.), pp. 1362–1371. PMLR, 2017.

    Leistungsnachweis

    Zum Ablauf der oben angegebenen Bearbeitungsfristen sind jeweils per Email als PDF dem Betreuer abzugeben:

    • der Foliensatz zur Präsentation
    • eine 10-15-seitige LaTeX-Ausarbeitung im LNCS Format (einspaltig, inklusive Bibliographie) 

    Vorherige Absprachen mit dem Betreuer sind ausdrücklich erwünscht. Alle verwendeten Referenzen sind zusätzlich zum Literaturverzeichnis der Ausarbeitung in http://www.bibsonomy.org in der entsprechenden Gruppe (relevantfor:uw_ws20_musikml) mit den Tags des jeweiligen Themas und weiteren sinnvollen Tags zu versehen.

    Die Vortragsdauer beträgt verbindlich 20 Minuten, nach dem Vortrag wird in der Seminargruppe diskutiert (ca. 10 Minuten). Der Vortrag (inkl. Folien und Abstract) geht mit 40% in die Endnote ein, die Ausarbeitung ebenfalls mit 30%. Die letzten 30% bewerten die Vorbereitung, Beteiligung in der Diskussionsrunde (insbesondere bei anderen Vorträgen), Eigenständigkeit der Ausarbeitung und Einhaltung von Terminen.

    Bearbeitungshinweise

    Als Richtlinie für die Erstellung einer guten Seminararbeit (inkl. Vortrag und Ausarbeitung) wird das Buch

    Markus Deininger and Horst Lichter and Jochen Ludewig and Kurt Schneider. Studien-Arbeiten: ein Leitfaden zur Vorbereitung, Durchführung und Betreuung von Studien-, Diplom- Abschluss- und Doktorarbeiten am Beispiel Informatik. 5. Auflage. vdf Hochschulverlag, Zürich, 2005. 

    empfohlen, welches beim Betreuer des Seminars (Prof. Dr. Andreas Hotho) ausliegt. Wir empfehlen die Anschaffung dieses Buchs (9,50 €), da es Sie bis zur Masterarbeit (und weiter) begleiten kann. Die Benotung der Seminararbeit erfolgt in Anlehnung an das dort auf Seite 77 angegebene Schema, angepasst auf die Erfordernisse einer Seminararbeit.