Seminar: Musik und Maschinelles Lernen

Veranstalter: Prof. Dr. Andreas Hotho, Daniel Schlör, Padraig Davidson

Dieses Seminar wird begleitend bzw. vorbereitend zum gleichnamigen Master-Praktikum angeboten. Ziel des Seminars ist gemeinsam die theoretischen Grundlagen zur Anwendung von Machine Learning auf ausgewählte musikalische Fragestellungen zu erarbeiten. Rundimentäres Grundwissen zu digitaler Musik (beispielsweise zum MIDI Format) bzw. zu Musik allgemein (was sind Noten und Notenwerte) bzw. das Interesse sich dieses anzueignen sowie Vorwissen aus dem Bereich Data Mining und Neuronale Netze sind empfehlenswert. Das Seminar richtet sich eher an Studierende im Master Informatik, kann aber auch im Bachelor besucht werden sofern Sie motiviert sind sich ggf. einzuarbeiten.

Bei Fragen oder zur Reservierung eines Themas/Platzes schreiben Sie bitte eine Email an Daniel Schlör.
Geben Sie dabei bitte immer den Studiengang und die Matrikelnummer mit an und ob Sie bereits verwandte Veranstaltungen wie beispielsweise Data Mining gehört oder anderweitig Vorwissen haben.

Im Unterschied zum Seminar Ausgewählte Themen des Machine Learning liegt der Fokus in diesem Seminar auf der praktischen Umsetzbarkeit der behandelten wissenschaftlichen Arbeiten. Das Seminar besteht entsprechend aus zwei Teilen: Im ersten Teil soll jedes vergebene Seminarthema didaktisch aufbereitet präsentiert werden. Die Seminargruppe diskutiert dann über die technische Umsetzung und mögliche Anwendungen. Der zweite Teil besteht aus der Ausarbeitung der Hausarbeit, in der die theoretischen Grundlagen in eigenen Worten wiedergegeben und diese auf ein zuvor vereinbartes Anwendungsbeispiel übertragen werden sollen.

Die Vorbesprechung wird über folgendes Zoom Meeting am 04.11.2020, 13:00 Uhr stattfinden:

https://uni-wuerzburg.zoom.us/j/97729255265?pwd=VnlKWmNENW1aVkFhQnlDb1hnbmltQT09

Corona News

Aufgrund der aktuellen Umstände wird das Seminar auf Online-Lehre umgestellt.
Nach der Erstbesprechung werden wir die Themen fest an Studenten vergeben. Themen bzw. Plätze können zuvor reserviert werden (siehe oben).

Alle Besprechungen und Vorträge werden nach aktuellem Stand über ZOOM veranstaltet. Wir bitten um eine funktionierende Kamera.

ZOOM
ZOOM benötigt einen vorinstallierten Client, der unter https://zoom.us/download verfügbar ist. Ein Account wird zur Teilnahme allerdings nicht benötigt. ZOOM ist außerdem auch auf Android und IOS verfügbar.
(ZOOM funktioniert auch im Browser. Diese Variante können wir aber aufgrund der schlechteren Performance nicht empfehlen.)

Themenvergabe und Vorbesprechung

Themen können schon vor dem Vorbesprechungstermin reserviert werden. Die Themen werden einige Zeit vor der Vorbesprechung hier auf dieser Seite bekannt gegeben.

Bei der Vorbesprechung werden die Themen - so nicht schon vergeben - an die anwesenden Seminarteilnehmer verteilt. Grundsätzlich besteht Anwesenheitspflicht. Teilnehmer, die bereits ein Thema bearbeiten, aber ohne Absprache fehlen, verlieren den Anspruch auf ihr Thema/ihren Platz.

Themen

Die Grundlage zu den Vorträgen bilden wissenschaftliche Aufsätze (Papers). Jedes hier aufgeführte Paper entspricht einem Thema.

Bei der Erstbesprechung werden übrige bzw. wieder frei gewordene Themen an anwesende Studenten verteilt. Wer möchte kann sich dafür auch auf eine Warteliste eintragen lassen (Anwesenheit trotzdem erforderlich).

Themen

Learning Style-Aware Symbolic Music Representations by Adversarial Autoencoders. Valenti, Andrea; Carta, Antonio; Bacciu, Davide. In ECAI, Vol. 325 of Frontiers in Artificial Intelligence and Applications, G. D. Giacomo, A. Catalá, B. Dilkina, M. Milano, S. Barro, A. Bugarín, J. Lang (eds.), pp. 1563–1570. IOS Press, 2020.
- [ BibTeX ]
- [ URL ]
- [ BibSonomy-Post ]
@inproceedings{conf/ecai/ValentiCB20, author = {Valenti, Andrea and Carta, Antonio and Bacciu, Davide}, booktitle = {ECAI}, crossref = {conf/ecai/2020}, editor = {Giacomo, Giuseppe De and Catalá, Alejandro and Dilkina, Bistra and Milano, Michela and Barro, Senén and Bugarín, Alberto and Lang, Jérôme}, keywords = {musikml}, pages = {1563-1570}, publisher = {IOS Press}, series = {Frontiers in Artificial Intelligence and Applications}, title = {Learning Style-Aware Symbolic Music Representations by Adversarial Autoencoders.}, volume = 325, year = 2020 }
PiRhDy: Learning Pitch-, Rhythm-, and Dynamics-aware Embeddings for Symbolic Music. Liang, Hongru; Lei, Wenqiang; Chan, Paul Yaozhu; Yang, Zhenglu; Sun, Maosong; Chua, Tat-Seng. In ACM Multimedia, C. W. Chen, R. Cucchiara, X.-S. Hua, G.-J. Qi, E. Ricci, Z. Zhang, R. Zimmermann (eds.), pp. 574–582. ACM, 2020.
- [ BibTeX ]
- [ URL ]
- [ BibSonomy-Post ]
@inproceedings{conf/mm/LiangLCYSC20, author = {Liang, Hongru and Lei, Wenqiang and Chan, Paul Yaozhu and Yang, Zhenglu and Sun, Maosong and Chua, Tat-Seng}, booktitle = {ACM Multimedia}, crossref = {conf/mm/2020}, editor = {Chen, Chang Wen and Cucchiara, Rita and Hua, Xian-Sheng and Qi, Guo-Jun and Ricci, Elisa and Zhang, Zhengyou and Zimmermann, Roger}, keywords = {musikml}, pages = {574-582}, publisher = {ACM}, title = {PiRhDy: Learning Pitch-, Rhythm-, and Dynamics-aware Embeddings for Symbolic Music.}, year = 2020 }
MIDI-Sandwich2: RNN-based Hierarchical Multi-modal Fusion Generation VAE networks for multi-track symbolic music generation. Liang, Xia; Wu, Junmin; Cao, Jing. In CoRR, abs/1909.03522. 2019.
- [ BibTeX ]
- [ URL ]
- [ BibSonomy-Post ]
@article{journals/corr/abs-1909-03522, author = {Liang, Xia and Wu, Junmin and Cao, Jing}, journal = {CoRR}, keywords = {musikml}, title = {MIDI-Sandwich2: RNN-based Hierarchical Multi-modal Fusion Generation VAE networks for multi-track symbolic music generation.}, volume = {abs/1909.03522}, year = 2019 }
LakhNES: Improving multi-instrumental music generation with cross-domain pre-training. Donahue, Chris; Mao, Huanru Henry; Li, Yiting Ethan; Cottrell, Garrison W.; McAuley, Julian J. In CoRR, abs/1907.04868. 2019.
- [ BibTeX ]
- [ URL ]
- [ BibSonomy-Post ]
@article{journals/corr/abs-1907-04868, author = {Donahue, Chris and Mao, Huanru Henry and Li, Yiting Ethan and Cottrell, Garrison W. and McAuley, Julian J.}, journal = {CoRR}, keywords = {musikml}, title = {LakhNES: Improving multi-instrumental music generation with cross-domain pre-training.}, volume = {abs/1907.04868}, year = 2019 }
Music Transformer: Generating Music with Long-Term Structure. Huang, Cheng-Zhi Anna; Vaswani, Ashish; Uszkoreit, Jakob; Simon, Ian; Hawthorne, Curtis; Shazeer, Noam; Dai, Andrew M.; Hoffman, Matthew D.; Dinculescu, Monica; Eck, Douglas. In ICLR (Poster). OpenReview.net, 2019.
- [ BibTeX ]
- [ URL ]
- [ BibSonomy-Post ]
@inproceedings{conf/iclr/HuangVUSHSDHDE19, author = {Huang, Cheng-Zhi Anna and Vaswani, Ashish and Uszkoreit, Jakob and Simon, Ian and Hawthorne, Curtis and Shazeer, Noam and Dai, Andrew M. and Hoffman, Matthew D. and Dinculescu, Monica and Eck, Douglas}, booktitle = {ICLR (Poster)}, crossref = {conf/iclr/2019}, keywords = {musikml}, publisher = {OpenReview.net}, title = {Music Transformer: Generating Music with Long-Term Structure.}, year = 2019 }
Graph Neural Network for Music Score Data and Modeling Expressive Piano Performance. Jeong, Dasaem; Kwon, Taegyun; Kim, Yoojin; Nam, Juhan. In ICML, Vol. 97 of Proceedings of Machine Learning Research, K. Chaudhuri, R. Salakhutdinov (eds.), pp. 3060–3070. PMLR, 2019.
- [ BibTeX ]
- [ URL ]
- [ BibSonomy-Post ]
@inproceedings{conf/icml/JeongKKN19, author = {Jeong, Dasaem and Kwon, Taegyun and Kim, Yoojin and Nam, Juhan}, booktitle = {ICML}, crossref = {conf/icml/2019}, editor = {Chaudhuri, Kamalika and Salakhutdinov, Ruslan}, keywords = {musikml}, pages = {3060-3070}, publisher = {PMLR}, series = {Proceedings of Machine Learning Research}, title = {Graph Neural Network for Music Score Data and Modeling Expressive Piano Performance.}, volume = 97, year = 2019 }
Encoding Musical Style with Transformer Autoencoders. Choi, Kristy; Hawthorne, Curtis; Simon, Ian; Dinculescu, Monica; Engel, Jesse H. In CoRR, abs/1912.05537. 2019.
- [ BibTeX ]
- [ URL ]
- [ BibSonomy-Post ]
@article{journals/corr/abs-1912-05537, author = {Choi, Kristy and Hawthorne, Curtis and Simon, Ian and Dinculescu, Monica and Engel, Jesse H.}, journal = {CoRR}, keywords = {musikml}, title = {Encoding Musical Style with Transformer Autoencoders.}, volume = {abs/1912.05537}, year = 2019 }
Harmony Transformer: Incorporating Chord Segmentation into Harmony Recognition. Chen, Tsung-Ping; Su, Li. In ISMIR, A. Flexer, G. Peeters, J. Urbano, A. Volk (eds.), pp. 259–267. 2019.
- [ BibTeX ]
- [ URL ]
- [ BibSonomy-Post ]
@inproceedings{conf/ismir/ChenS19, author = {Chen, Tsung-Ping and Su, Li}, booktitle = {ISMIR}, crossref = {conf/ismir/2019}, editor = {Flexer, Arthur and Peeters, Geoffroy and Urbano, Julián and Volk, Anja}, keywords = {musikml}, pages = {259-267}, title = {Harmony Transformer: Incorporating Chord Segmentation into Harmony Recognition.}, year = 2019 }
Symbolic Music Genre Transfer with CycleGAN. Brunner, Gino; Wang, Yuyi; Wattenhofer, Roger; Zhao, Sumu. In ICTAI, L. H. Tsoukalas, Éric Grégoire, M. Alamaniotis (eds.), pp. 786–793. IEEE, 2018.
- [ BibTeX ]
- [ URL ]
- [ BibSonomy-Post ]
@inproceedings{conf/ictai/BrunnerWWZ18, author = {Brunner, Gino and Wang, Yuyi and Wattenhofer, Roger and Zhao, Sumu}, booktitle = {ICTAI}, crossref = {conf/ictai/2018}, editor = {Tsoukalas, Lefteri H. and Grégoire, Éric and Alamaniotis, Miltiadis}, keywords = {musikml}, pages = {786-793}, publisher = {IEEE}, title = {Symbolic Music Genre Transfer with CycleGAN.}, year = 2018 }
MuseGAN: Multi-track Sequential Generative Adversarial Networks for Symbolic Music Generation and Accompaniment. Dong, Hao-Wen; Hsiao, Wen-Yi; Yang, Li-Chia; Yang, Yi-Hsuan. In AAAI, S. A. McIlraith, K. Q. Weinberger (eds.), pp. 34–41. AAAI Press, 2018.
- [ BibTeX ]
- [ URL ]
- [ BibSonomy-Post ]
@inproceedings{conf/aaai/DongHYY18, author = {Dong, Hao-Wen and Hsiao, Wen-Yi and Yang, Li-Chia and Yang, Yi-Hsuan}, booktitle = {AAAI}, crossref = {conf/aaai/2018}, editor = {McIlraith, Sheila A. and Weinberger, Kilian Q.}, keywords = {musikml}, pages = {34-41}, publisher = {AAAI Press}, title = {MuseGAN: Multi-track Sequential Generative Adversarial Networks for Symbolic Music Generation and Accompaniment.}, year = 2018 }
DeepBach: a Steerable Model for Bach Chorales Generation. Hadjeres, Gaëtan; Pachet, François; Nielsen, Frank. In ICML, Vol. 70 of Proceedings of Machine Learning Research, D. Precup, Y. W. Teh (eds.), pp. 1362–1371. PMLR, 2017.
- [ BibTeX ]
- [ URL ]
- [ BibSonomy-Post ]
@inproceedings{conf/icml/HadjeresPN17, author = {Hadjeres, Gaëtan and Pachet, François and Nielsen, Frank}, booktitle = {ICML}, crossref = {conf/icml/2017}, editor = {Precup, Doina and Teh, Yee Whye}, keywords = {musikml}, pages = {1362-1371}, publisher = {PMLR}, series = {Proceedings of Machine Learning Research}, title = {DeepBach: a Steerable Model for Bach Chorales Generation.}, volume = 70, year = 2017 }

Leistungsnachweis

Zum Ablauf der oben angegebenen Bearbeitungsfristen sind jeweils per Email als PDF dem Betreuer abzugeben:

der Foliensatz zur Präsentation
eine 10-15-seitige LaTeX-Ausarbeitung im LNCS Format (einspaltig, inklusive Bibliographie)

Vorherige Absprachen mit dem Betreuer sind ausdrücklich erwünscht. Alle verwendeten Referenzen sind zusätzlich zum Literaturverzeichnis der Ausarbeitung in http://www.bibsonomy.org in der entsprechenden Gruppe (relevantfor:uw_ws20_musikml) mit den Tags des jeweiligen Themas und weiteren sinnvollen Tags zu versehen.

Die Vortragsdauer beträgt verbindlich 20 Minuten, nach dem Vortrag wird in der Seminargruppe diskutiert (ca. 10 Minuten). Der Vortrag (inkl. Folien und Abstract) geht mit 40% in die Endnote ein, die Ausarbeitung ebenfalls mit 30%. Die letzten 30% bewerten die Vorbereitung, Beteiligung in der Diskussionsrunde (insbesondere bei anderen Vorträgen), Eigenständigkeit der Ausarbeitung und Einhaltung von Terminen.

Bearbeitungshinweise

Als Richtlinie für die Erstellung einer guten Seminararbeit (inkl. Vortrag und Ausarbeitung) wird das Buch

Markus Deininger and Horst Lichter and Jochen Ludewig and Kurt Schneider. Studien-Arbeiten: ein Leitfaden zur Vorbereitung, Durchführung und Betreuung von Studien-, Diplom- Abschluss- und Doktorarbeiten am Beispiel Informatik. 5. Auflage. vdf Hochschulverlag, Zürich, 2005.

empfohlen, welches beim Betreuer des Seminars (Prof. Dr. Andreas Hotho) ausliegt. Wir empfehlen die Anschaffung dieses Buchs (9,50 €), da es Sie bis zur Masterarbeit (und weiter) begleiten kann. Die Benotung der Seminararbeit erfolgt in Anlehnung an das dort auf Seite 77 angegebene Schema, angepasst auf die Erfordernisse einer Seminararbeit.

Picture credits