Zurück zur Übersicht


INFMW  P: Data Science I, II, III SG INF
Dozent : Dipl.-Inform. Ingo Boersch    eMail
Prof. Dr. Sven Buchholz    eMail
Semester 1
Einordnung : Master Informatik (Winter-Immatrikulation), Projekte Informatik SWS 3
Sprache : Deutsch Art L
Prüfungsart : PL  Credits
Prüfungsform : Belegarbeit mit mdl. Prüfungsgespräch 
Voraussetzungen :
Querverweise :  
Vorkenntnisse :  
Hilfsmittel und Besonderheiten :  
Lehrziele :  
Lehrinhalte :

Data Mining
Teilnehmer: 1-2 Studierende
Möglichkeit zur Masterarbeit: ja
Vorkenntnisse: Grundlagen der Wissensverarbeitung, Interesse an maschinellem Lernen

Data Mining ist die Gewinnung bislang unbekannter und nützlicher Informationen aus Datenmengen. Im Projekt lernen Sie verschiedene Methoden und Aspekte der Suche nach Regelmäßigkeiten in Datenmengen kennen und wenden diese praxisnah an. Dabei ist es erstaunlich, wie gut bereits einfache Algorithmen interessante Regeln entdecken können. Reale Datenmengen im Projekt stammen aus dem medizinischen, sozialen und auch industriellen Bereich und sind in der Regel mit konkreten Kundenwünschen verknüpft. Das Anwendungsproblem und die Beschaffenheit der Daten entscheiden, ob eher die Bestimmung relevanter Merkmale, die Modellierung von Zusammenhängen oder bspw. die Visualisierung im Vordergrund steht.

Literatur: Witten, Ian H. ; Frank, Eibe: Data Mining. Praktische Werkzeuge und Techniken für das maschinelle Lernen. Hanser Fachbuch, 2001 (12 Exemplare in der Bibliothek)

Datenmanagement
Teilnehmer: 1-2 Studierende
Möglichkeit zur Masterarbeit: ja
Vorkenntnisse: DBS 1 und 2, Interesse an DBS

Der Großteil aller heute verfügbaren Daten ist semistrukturiert oder unstrukturiert, z.B. Texte, Bilder oder Videos. Für diese Daten sind relationale DBS nicht gut geeignet. Im Projekt lernen Sie verschiedene NoSQL-Ansätze kennen und vertiefen dann die Anwendung eines bestimmten Systems, z.B. MongoDB, an realen Daten.

Literatur: Celko, Joe: Complete Guide to NoSQL. Morgan Kaufmann, 2013

Algorithmen für Big Data
Teilnehmer: 1-2 Studierende
Möglichkeit zur Masterarbeit: ja
Interesse an Algorithmen und Datenstukturen

Für "Big Data" haben sich spezielle Algorithmen und Datenstrukturen entwickelt. Oft sind diese probabilistischer Natur d.h. es wird Exaktheit für bessere Laufzeit und/oder geringeren Speicherverbrauch eingetauscht. Nach dem Verschaffen eines Überblicks sollen im Projekt konkrete Implementierungen solcher Algorithmen an praktischen Beispielen evaluiert werden.

Literatur: Rajaraman Anand; Ullman Jeff: Mining of Massive Datasets. Cambridge University Press, 2011 

Literatur :  


Zurück zur Übersicht