Zurück zur Übersicht

INFMW P: Data Science I, II, III		SG	INF
Dozent :	Dipl.-Inform. Ingo Boersch eMail Prof. Dr. Sven Buchholz eMail	Semester	1
Einordnung :	Master Informatik (Winter-Immatrikulation), Projekte Informatik	SWS	3
Sprache :	Deutsch	Art	L
Prüfungsart :	PL	Credits	0
Prüfungsform :	Belegarbeit mit mdl. Prüfungsgespräch
Voraussetzungen :
Querverweise :
Vorkenntnisse :
Hilfsmittel und Besonderheiten :
Lehrziele :
Lehrinhalte :	Data Mining Teilnehmer: 1-2 Studierende Möglichkeit zur Masterarbeit: ja Vorkenntnisse: Grundlagen der Wissensverarbeitung, Interesse an maschinellem Lernen Data Mining ist die Gewinnung bislang unbekannter und nützlicher Informationen aus Datenmengen. Im Projekt lernen Sie verschiedene Methoden und Aspekte der Suche nach Regelmäßigkeiten in Datenmengen kennen und wenden diese praxisnah an. Dabei ist es erstaunlich, wie gut bereits einfache Algorithmen interessante Regeln entdecken können. Reale Datenmengen im Projekt stammen aus dem medizinischen, sozialen und auch industriellen Bereich und sind in der Regel mit konkreten Kundenwünschen verknüpft. Das Anwendungsproblem und die Beschaffenheit der Daten entscheiden, ob eher die Bestimmung relevanter Merkmale, die Modellierung von Zusammenhängen oder bspw. die Visualisierung im Vordergrund steht. Literatur: Witten, Ian H. ; Frank, Eibe: Data Mining. Praktische Werkzeuge und Techniken für das maschinelle Lernen. Hanser Fachbuch, 2001 (12 Exemplare in der Bibliothek) Datenmanagement Teilnehmer: 1-2 Studierende Möglichkeit zur Masterarbeit: ja Vorkenntnisse: DBS 1 und 2, Interesse an DBS Der Großteil aller heute verfügbaren Daten ist semistrukturiert oder unstrukturiert, z.B. Texte, Bilder oder Videos. Für diese Daten sind relationale DBS nicht gut geeignet. Im Projekt lernen Sie verschiedene NoSQL-Ansätze kennen und vertiefen dann die Anwendung eines bestimmten Systems, z.B. MongoDB, an realen Daten. Literatur: Celko, Joe: Complete Guide to NoSQL. Morgan Kaufmann, 2013 Algorithmen für Big Data Teilnehmer: 1-2 Studierende Möglichkeit zur Masterarbeit: ja Interesse an Algorithmen und Datenstukturen Für "Big Data" haben sich spezielle Algorithmen und Datenstrukturen entwickelt. Oft sind diese probabilistischer Natur d.h. es wird Exaktheit für bessere Laufzeit und/oder geringeren Speicherverbrauch eingetauscht. Nach dem Verschaffen eines Überblicks sollen im Projekt konkrete Implementierungen solcher Algorithmen an praktischen Beispielen evaluiert werden. Literatur: Rajaraman Anand; Ullman Jeff: Mining of Massive Datasets. Cambridge University Press, 2011
Literatur :

Zurück zur Übersicht