Lehrver­anstaltung

DDML - Data Mining


PDF Lehrveranstaltungsverzeichnis English Version: DDML

Version: 1 | Letzte Änderung: 12.02.2021 13:46 | Entwurf: 0 | Status: vom verantwortlichen Dozent freigegeben

Langname Data Mining
Anerkennende LModule DML_BaET
Verantwortlich
Prof. Dr. Beate Rhein
Professor Fakultät IME
Niveau Bachelor
Semester im Jahr Wintersemester
Dauer Semester
Stunden im Selbststudium 78
ECTS 5
Dozenten
Prof. Dr. Beate Rhein
Professor Fakultät IME
Voraussetzungen Aus Mathematik 1 und 2 wird die Fähigkeit benötigt, mathematische Modelle aufzustellen, sowie Kenntnisse der Differentialrechnung und der Linearen Algebra.
Unterrichtssprache deutsch
separate Abschlussprüfung Ja
Literatur
keine/none
Abschlussprüfung
Details
Abhängig von der Anzahl der Teilnehmer:
Bei wenigen Teilnehmern Kombination aus Klausur oder mündlicher Prüfung und Bewertung des Mini-Projektes
Bei vielen Teilnehmern Prüfung durch Klausur; Mini-Projekt als Voraussetzung zur Teilnahme an der Klausur

In der Klausur bzw. mündlichen Prüfung werden die Methoden, Vorgehensweisen, Fallstricke und gesetzliche Grundlagen des Data Mining geprüft.

Im Mini-Projekt wird die Fähigkeit zu selbständigem eigenverantwortlichem Handeln und der Umgang mit geeigneter Software abgeprüft.
Mindeststandard
Grundkenntnisse der generellen Vorgehensweise beim Data Mining, der behandelten Verfahren und ihre Grenzen
Prüfungstyp
Abhängig von der Anzahl der Teilnehmer:
Bei wenigen Teilnehmern Kombination aus Klausur oder mündlicher Prüfung und Bewertung des Mini-Projektes
Bei vielen Teilnehmern Prüfung durch Klausur; Mini-Projekt als Voraussetzung zur Teilnahme an der Klausur

In der Klausur bzw. mündlichen Prüfung werden die Methoden, Vorgehensweisen, Fallstricke und gesetzliche Grundlagen des Data Mining geprüft.

Im Mini-Projekt wird die Fähigkeit zu selbständigem eigenverantwortlichem Handeln und der Umgang mit geeigneter Software abgeprüft.

Lernziele

Kenntnisse
Einführung in eine geeignete Software, z.B. Python
Einführung in deskriptive Statistik und evtl. auch Wahrscheinlichkeitsrechnung
Überwachtes Lernen:
- Klassifikationsverfahren: Ablauf, Performanzmaße, Anwendung eines Verfahrens des instanzbasierten Lernen, z.B. k-nearest-neighbor und eines Verfahrens des modellbasierten Lernen, z.B. Entscheidungsbäume
- evtl. Regressionsanalyse: über maschinelles Lernen und klassisch
Unüberwachtes Lernen:
- Clusteranalyse: k-means, evtl. auch DBSCAN
Preprocessing der Daten:
- Behandlung von beschädigten / fehlenden Daten
- Ausreißer oder Noise - Problematik
- Skalierung
- Visualisierung der Daten

- evtl. Dimensionsreduzierung
- Beurteilung der Qualität der Daten
- evtl. verschiedene Arten von Datensätzen betrachten, Bezug zu NoSql-Datenbanken herstellen, Ausblick auf aktuelle Forschung, z.B. Bilderkennung, Natural Language Processing, Reinforcement Learning

Fertigkeiten
zu Aufgabenstellungen geeignete Methode und Gesamtvorgehensweise nennen und anwenden können
geeignetes Performanzmaß wählen und beurteilen
Datenschutzrichtlinien anwenden
Aufwand Präsenzlehre
Typ Präsenzzeit (h/Wo.)
Vorlesung 2
Übungen (ganzer Kurs) 0
Übungen (geteilter Kurs) 2
Tutorium (freiwillig) 0
Besondere Literatur
A. Geron: Praxiseinstieg Machine Learning mit Scikit-Learn und TensorFlow: Konzepte, Tools und Techniken für intelligente Systeme, Heidelberg, o‘Reilly Verlag 2017, 978-3960090618, S. Raschka, V. Mirjalili: Machine Learning mit Python und Scikit-Learn und TensorFlow: Das umfassende Praxis-Handbuch für Data Science, Predictive Analytics und Deep Learning, mitp Verlag, 2018, 978-3958457331, J. Frochte, Jörg: Maschinelles Lernen, München, Carl Hanser Verlag GmbH & Co. KG, 2018, eBook ISBN: 978-3-446-45705-8, Print ISBN: 978-3-446-45291-6, A. Müller: Einführung in Machine Learning mit Python: Praxiswissen Data Science, Heidelberg, o‘Reilly Verlag 2017, eBook: 978-3-96010-111-6
Besondere Voraussetzungen
keine
Begleitmaterial
Skript bzw. Foliensatz
Aufgabenstellungen (voraussichtlich in Skript integriert)
Mini-Projekt-Aufgabe mit Datensatz
Separate Prüfung
keine

© 2022 Technische Hochschule Köln