Data Mining
Die Vorlesung gibt einen Überblick über die Wissensgewinnung aus (strukturierten) Daten. Dazu gehören unter anderem:
- Vorverabeitungstechniken
- OLAP-Analyse & Data-Warehousing
- Clustering (k-means, k-medoids, DBSCAN, OPTICS)
- Klassifikation (k-Nearest-Neighbor, Bayes, Entscheidungsbaum, Support Vector Machine; Bagging, Boosting, z. B. Random Forest, AdaBoost)
- Regressionsanalyse (Linear Regression, Logistic Regression)
- Assoziationsregellernen (Aprioiri, FP-Growth)
- Einführung in Deep Learning
Organisatorisches
- Vorlesung:
Di, 10:15 - 11:45 (Achtung: neue Veranstaltungszeit im Vergleich zu den vorherigen Semestern)
Zuse
Erster Veranstaltungstag: 30.04.2019 - Übung:
Do, 14:15 - 15:45
Informatik - Übungsraum II
Do, 16:15 - 17:45
Informatik - Seminarraum 3
Fr 14:15 - 15:45
Informatik - SE I
Erster Veranstaltungstag: 09.05.2019 - WueCampus-Kurs: Link zum Kurs
- Anmeldung: Eine Anmeldung vor der ersten Vorlesung ist nicht nötig! Die genauen Einschreibemodalitäten werden in der ersten Vorlesungssitzung bekannt gegeben.
- Prüfung: Hinweis: Es werden unterschiedliche Prüfungen für Bachelor- und Masterstudierende angeboten.
Literatur
-
Knowledge Discovery in Databases: Techniken und Anwendungen. . 1st ed. Springer Berlin Heidelberg, 2000.
-
CRISP-DM 1.0 Step-by-step data mining guide. . The CRISP-DM consortium, 2000.
-
Advances in Knowledge Discovery and Data Mining. . AAAI/MIT Press, 1996.
- [ BibTeX ]
Weitere Literatur zur Vorlesung
-
Sequential minimal optimization: A fast algorithm for training support vector machines. . 1998.
-
OPTICS: Ordering Points To Identify the Clustering Structure. . bll 49–60. ACM Press, 1999.
- [ BibTeX ]
-
On End-to-End Program Generation from User Intention by Deep Neural Networks. . In CoRR, abs/1510.07211. 2015.
-
Mining Frequent Patterns without Candidate Generation. . In SIGMOD Conference, W. Chen, J. F. Naughton, P. A. Bernstein (reds.), bll 1–12. ACM, 2000.
-
Maximum likelihood from incomplete data via the {EM} algorithm. . In Journal of the Royal Statistical Society: Series B, 39, bll 1–38. 1977.
-
Experiments with a New Boosting Algorithm. . In International Conference on Machine Learning, bll 148–156. 1996.
-
Experimental evidence of massive-scale emotional contagion through social networks. . In Proceedings of the National Academy of Sciences, 111(24), bll 8788–8790. 2014.
-
Data Science and Prediction. . In Commun. ACM, 56(12), bll 64–73. ACM, New York, NY, USA, 2013.
-
Data Science and its Relationship to Big Data and Data-Driven Decision Making. . In Big Data, 1(1), bll 51–59. Mary Ann Liebert Inc, 2013.
- [ BibTeX ]
-
Clustering by means of medoids. . I. D. Y; editor (reds.), bll 405–416. North Holland / Elsevier, Amsterdam:, 1987.
- [ BibTeX ]
-
Bagging, Boosting, and C4.5. . In AAAI/IAAI, Vol. 1, W. J. Clancey, D. S. Weld (reds.), bll 725–730. AAAI Press / The MIT Press, 1996.
-
Automatic Subspace Clustering of High Dimensional Data for Data Mining Applications. . In Proceedings of the ACM SIGMOD Int’l Conference on Management of Data, Seattle, Washington, bll 94–105. ACM Press, 1998.
- [ BibTeX ]
-
A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise. . In Proc. of 2nd International Conference on Knowledge Discovery and, bll 226–231. 1996.
- [ BibTeX ]