Data Mining
Die Vorlesung gibt einen Überblick über die Wissensgewinnung aus (strukturierten) Daten. Dazu gehören unter anderem:
- Vorverabeitungstechniken
- OLAP-Analyse & Data-Warehousing
- Clustering (k-means, k-medoids, DBSCAN, OPTICS)
- Klassifikation (k-Nearest-Neighbor, Bayes, Entscheidungsbaum, Support Vector Machine; Bagging, Boosting, z. B. Random Forest, AdaBoost)
- NEU: Regressionsanalyse (Linear Regression, Logisitic Regression)
- Assoziationsregellernen (Aprioiri, FP-Growth)
- Subgruppenentdeckung (wird ggf. durch eine Einführung in Deep Learning ersetzt TBA)
Organisatorisches
- Vorlesung:
Di, 12:15 - 13:45
Informatik - Übungsraum II
Erster Veranstaltungstag: 19.04.2016 - Übung:
Do, 14:15 - 15:45
Informatik - Übungsraum II
Do, 16:15 - 17:45
Informatik - Seminarraum 3
Erster Veranstaltungstag: 28.04.2016 - WueCampus-Kurs: Link zum Kurs
- Anmeldung: Eine Anmeldung vor der ersten Vorlesung ist nicht nötig! Die genauen Einschreibemodalitäten werden in der ersten Vorlesungssitzung bekannt gegeben.
- Prüfung SS 2016: 12.07.2015 12:30 Zuse
- Prüfung WS 2016/17: TBA. Anmeldung über sb@home
Literatur
-
Knowledge Discovery in Databases: Techniken und Anwendungen. . 1st ed. Springer Berlin Heidelberg, 2000.
-
CRISP-DM 1.0 Step-by-step data mining guide. . The CRISP-DM consortium, 2000.
-
Advances in Knowledge Discovery and Data Mining. . AAAI/MIT Press, 1996.
- [ BibTeX ]
Weitere Literatur zur Vorlesung
-
Sequential minimal optimization: A fast algorithm for training support vector machines. . 1998.
-
OPTICS: Ordering Points To Identify the Clustering Structure. . pp. 49–60. ACM Press, 1999.
- [ BibTeX ]
-
On End-to-End Program Generation from User Intention by Deep Neural Networks. . In CoRR, abs/1510.07211. 2015.
-
Mining Frequent Patterns without Candidate Generation. . In SIGMOD Conference, W. Chen, J. F. Naughton, P. A. Bernstein (eds.), pp. 1–12. ACM, 2000.
-
Maximum likelihood from incomplete data via the EM algorithm. . In Journal of the Royal Statistical Society: Series B, 39, pp. 1–38. 1977.
-
Experiments with a New Boosting Algorithm. . In International Conference on Machine Learning, pp. 148–156. 1996.
-
Experimental evidence of massive-scale emotional contagion through social networks. . In Proceedings of the National Academy of Sciences, 111(24), pp. 8788–8790. 2014.
-
Data Science and Prediction. . In Commun. ACM, 56(12), pp. 64–73. ACM, New York, NY, USA, 2013.
-
Data Science and its Relationship to Big Data and Data-Driven Decision Making. . In Big Data, 1(1), pp. 51–59. Mary Ann Liebert Inc, 2013.
- [ BibTeX ]
-
Clustering by means of medoids. . I. D. Y; editor (eds.), pp. 405–416. North Holland / Elsevier, Amsterdam:, 1987.
- [ BibTeX ]
-
Bagging, Boosting, and C4.5. . In AAAI/IAAI, Vol. 1, W. J. Clancey, D. S. Weld (eds.), pp. 725–730. AAAI Press / The MIT Press, 1996.
-
Automatic Subspace Clustering of High Dimensional Data for Data Mining Applications. . In Proceedings of the ACM SIGMOD Int’l Conference on Management of Data, Seattle, Washington, pp. 94–105. ACM Press, 1998.
- [ BibTeX ]
-
A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise. . In Proc. of 2nd International Conference on Knowledge Discovery and, pp. 226–231. 1996.
- [ BibTeX ]