Die hier hinterlegten Angaben dienen rein der Information und besitzen keine Rechtsgültigkeit. Verbindliche Informationen sind ausschließlich im Modulhandbuch veröffentlicht.
Die Studierenden haben ihr bereits vorhandenes Wissen auf dem Gebiet der Datenbanken und Datenbanktechnologien erweitert und vertieft. Die Studierenden erwerben fundierte Kenntnisse in der Anwendung von SQL zur Abfrage und Manipulation von Daten in relationalen Datenbanken und lernen den Einsatz von ETL-Tools (Extract, Transform, Load) zur effizienten Extraktion, Transformation und Integration von Daten aus verschiedenen Quellen in ein zentrales System. Die Studierenden verstehen die Prinzipien von Transaktionen und Mehrbenutzerbetrieb in Datenbanksystemen und sind in der Lage, diese Konzepte auf reale Anwendungen anzuwenden.
Ein weiteres zentrales Lernziel ist das Verständnis der Informationssuche und des Information Retrieval. Die Studierenden lernen, wie Informationssysteme strukturiert und durchsucht werden, um relevante Daten aus großen Datenmengen zu extrahieren.
Die Studierenden verstehen den Prozess des Schema-Matchings, bei dem sie unterschiedliche Datenschemas analysieren und semantische Übereinstimmungen identifizieren, um eine korrekte Datenintegration in heterogenen Informationssystemen zu ermöglichen. Die Studierenden kennen typische Probleme der Datenqualität, wie Duplikaterkennung, Datenfusion und Konfliktbehandlung, und verstehen die entsprechenden Algorithmen und Modelle zur Lösung dieser Probleme, einschließlich der Definition von Ähnlichkeitsmaßen und der Auswahl von Algorithmen in Bezug auf Effektivität und Effizienz.
Darüber hinaus lernen die Studierenden die Grundlagen von NoSQL-Datenbanken und deren Einsatzgebiete. Sie verstehen die Unterschiede zu relationalen Datenbanken und die Herausforderungen bei der Skalierung in verteilten Systemen. Zudem werden sie mit den Konzepten des CAP-Theorems und den Anforderungen moderner Big Data-Systeme vertraut gemacht.
Am Ende des Kurses sind die Studierenden in der Lage, relationale und nicht-relationale Datenbanken zu entwerfen und zu verwalten, Datenintegrationsprozesse effizient zu gestalten und komplexe Datenqualitätsprobleme zu lösen. Sie sind mit den relevanten Algorithmen und Technologien ausgestattet, um in modernen Datenbankumgebungen erfolgreich zu arbeiten, insbesondere in verteilten und skalierbaren Systemen wie denen, die im Big Data-Bereich zum Einsatz kommen.
Vorlesung, Übungen am PC
Deutsch
PL
Klausur
6
4