3 Management Von Daten-Teil2
3 Management Von Daten-Teil2
Sommersemester 2025
Wirtschaftsinformatik
Professur für Anwendungssysteme und E-Business
Georg-August-Universität Göttingen
19.05.2025 4
© Professur für Anwendungssysteme und E-Business
Kapitel 3: Management von Daten
19.05.2025 6
© Professur für Anwendungssysteme und E-Business
Relationales Datenbankmodell
• Einziges Strukturelement: Relation = Tabelle mit einer festen Anzahl von Spalten
und einer beliebigen Anzahl von Zeilen (= Entities oder sog. Tupel)
19.05.2025 7
© Professur für Anwendungssysteme und E-Business
Beispiel zum relationalen Modell
Relation „Artikel“
19.05.2025 8
© Professur für Anwendungssysteme und E-Business
Eigenschaften von Relationen
Primarschlüssel Fremdschlüssel
19.05.2025 9
© Professur für Anwendungssysteme und E-Business
Darstellung einer N:1-Beziehung im relationalen Modell
Relation „Artikel“
Primärschlüssel Fremdschlüssel
Relation „Warengruppe“
Waren_Gruppe Warengr_Bezeichnung
A Boxen
B CD-Player
C Radio
D Verstärker
Primärschlüssel
19.05.2025 10
© Professur für Anwendungssysteme und E-Business
Darstellung einer N:M-Beziehung im relationalen Modell
0764245 15003 1
6321552 15003 2
8642119 23845 1
5623478 23845 3
6764374 97322 1
19.05.2025 11
© Professur für Anwendungssysteme und E-Business
Kategorisierung von Schlüsselfeldern
• Primärschlüssel
– Identifiziert durch seine Wertausprägung einen Datensatz eindeutig
– Einfacher Primärschlüssel = ein Attribut (oft als sog. „künstlicher“ Schlüssel, wie z. B.
Personalnummer)
– Zusammengesetzter Primärschlüssel = mehrere Attribute
Primärschlüssel
• Sekundärschlüssel
Alle Attributkombinationen mit datensatzidentifizierenden Eigenschaften, die nicht
Primärschlüssel sind (z. B. Name, Vorname und Geburtsdatum neben einem
Primärschlüssel „Personalnummer“)
• Fremdschlüssel
Sind Primärschlüssel in anderen Tabellen bzw. Dateien
19.05.2025 12
© Professur für Anwendungssysteme und E-Business
SQL als Abfragesprache
• Beispielabfrage:
SELECT Name FROM Kunde WHERE Kundennr=`6321552`
19.05.2025 13
© Professur für Anwendungssysteme und E-Business
SQL als Abfragesprache
19.05.2025 14
© Professur für Anwendungssysteme und E-Business
Blockchain (Distributed Ledger)
Validierung
Initiierung Update
und Konsens
Auslösung des Validierung Aktualisierung jeder Kopie
Übertrags Überprüfung auf Korrektheit der Datenbank im Netzwerk
(Wert oder Information) und Zulässigkeit
✓
Konsens
Entscheidung, in welcher
Reihenfolge Transaktion oder
Information angereiht wird
19.05.2025 15
© Professur für Anwendungssysteme und E-Business
Übersicht - Kapitel 3: Management von Daten
19.05.2025 16
© Professur für Anwendungssysteme und E-Business
Data Warehouse
19.05.2025 17
© Professur für Anwendungssysteme und E-Business
Grundkomponenten des Data Warehouse
Speicherung gemäß
Datenbereitstellung Data Mining
Datenmodell
- Interne Daten
- Externe Daten Datenvisualisierung
Zugriff
Transformation Individuelle
Aktualisierung / Wartung
Anwendungen
Datenorganisation
physikalisch
und logisch
Datenmanagement Aufbereitung /
d. h. Zugang Auswertung
und Umformung
19.05.2025 18
© Professur für Anwendungssysteme und E-Business
Schematischer Aufbau eines idealtypischen Data Warehouse
Daten-
quellen
Operative Daten
Datenzugriff
ETL-Prozess und Analyse
Data
Kundendaten Extrahieren Warehouse Abfragen &
Berichte
interne
Transformieren OLAP
Produktions-
daten
Laden Dashboards
Historische
Daten
externe
Externe Daten
19.05.2025 19
© Professur für Anwendungssysteme und E-Business
Data Mining und OLAP
19.05.2025 20
© Professur für Anwendungssysteme und E-Business
Externe Datenbanken und Internet
Einbinden externer Quellen (Internet und externe Datenbanken) zur Befriedigung der
Informationsbedarfe eines Unternehmens:
19.05.2025 21
© Professur für Anwendungssysteme und E-Business
Suchmaschinen
• Beispiele:
• Komponenten:
– Spider / Crawler: Softwareagenten zur Analyse von Internetseiten
– Index / Katalog: Datenstruktur mit Informationen über gefundene Webseiten
– Suchsoftware: Bearbeitung von Suchanfragen mit Hilfe des Katalogs und Darstellung
der Ergebnisse
19.05.2025 23
© Professur für Anwendungssysteme und E-Business
Big Data - Motivation
• Datenquellen
– Webseiten, E-Commerce, Social Media
– Wissenschaftliche & medizinische Instrumente
– Finanztransaktionen, Börsendaten
– Sensortechnologien und –netzwerke
– u.v.m.
19.05.2025 24
© Professur für Anwendungssysteme und E-Business
Big Data - Begriffsdefinition
• Sammelbegriff für
– Datenmengen, die zu
▪ groß,
▪ komplex,
▪ schnelllebig oder
▪ schwach strukturiert sind,
um diese mit herkömmlichen Methoden der Datenverarbeitung auszuwerten
19.05.2025 25
© Professur für Anwendungssysteme und E-Business
Anforderungen an Big Data-Anwendungen – die 5-V
Variety Volume
(Verschie- (Menge)
denartigkeit)
Veracity Value
Fähigkeit durch
Vertrauenswürdigkeit, (Glaubwür- (Wert) Analyse der
€£
Verantwortlichkeit, digkeit)
Datenbestände
Authentizität von Velocity ökonomischen Nutzen
Daten und -quellen (Geschwindig- zu generieren
sicherstellen keit)
!
Geschwindigkeit in der neue
Daten entstehen & beim
Speichern, Analysieren,
Wiederverwenden der Daten
19.05.2025 26
© Professur für Anwendungssysteme und E-Business
Übersicht - Kapitel 3: Management von Daten
19.05.2025 27
© Professur für Anwendungssysteme und E-Business
Maschinelles Lernen
Unterschiedliche Lernverfahren
19.05.2025 28
© Professur für Anwendungssysteme und E-Business
Anwendungsbeispiele für Überwachtes Lernen
19.05.2025 29
© Professur für Anwendungssysteme und E-Business
Die Bedeutung von Daten
• Für das Trainieren wird eine große Menge an gelabelten Daten benötigt
• Jedes KI-Modell ist nur so gut, wie die zugrunde liegende Datenbasis
(„garbage in, garbage out“-Prinzip)
19.05.2025 30
© Professur für Anwendungssysteme und E-Business
Elemente eines KNN
= Element, Neuron
eines KNN
= Verbindungen zwi-
schen Elementen
Schicht eines
KNN
E in g a b e - Z w is c h e n e b e n e A usgangs-
ebene 0 - n S c h ic h te n ebene
19.05.2025 31
© Professur für Anwendungssysteme und E-Business
Beispiel für die Verknüpfung von Neuronen (PE)
W1j W j1
Wjk
Ok
W ij
I
j PE j Oj
j I
k PE k
W jm
Oi
I
i PE i W nj
19.05.2025 32
© Professur für Anwendungssysteme und E-Business
Beispiel zum Bestimmen der Ausgabeinformation
+ 1 + 1 + 1
I I I
-1 - 1
- 1
[ -1 / 1 ] - Verteilung Schwellwert- SIGMOIDE-
Konzept Verteilung
19.05.2025 33
© Professur für Anwendungssysteme und E-Business
Data Mining Prozess
19.05.2025 34
© Professur für Anwendungssysteme und E-Business
Text Mining Prozess
19.05.2025 35
© Professur für Anwendungssysteme und E-Business
Generative KI
ChatGPT
LLama
Text
Synthesia Get3D
Video 3D-Objekte
Sora Adobe Firefly
Generative KI
Stable Diffusion
Midjourney
DALL-E
19.05.2025 36
© Professur für Anwendungssysteme und E-Business
Beispiel für „Deepfakes“
[Link]
Organisationen/Informationen-und-Empfehlungen/Kuenstliche-
Intelligenz/Deepfakes/deepfakes_node.html#doc1009562bodyText5
19.05.2025 37
© Professur für Anwendungssysteme und E-Business
Sprachmodelle
• Beispiel:
Da es heute Regnen soll denke ich beim Verlassen der Wohnung an einen ___________
Wahrscheinlichkeit Token
60,7% Regenschirm
12,4% Regenmantel
5,3% Regenbogen
1,9% Schlüssel
19.05.2025 38
© Professur für Anwendungssysteme und E-Business
Trainingsprozess eines Large Language Modells
Das Belohnungsmodell
berechnet eine „Belohnung“
Anwenden des für das Ereignis.
überwachten Die Daten werden
Lernens. benutzt, um mit einem Die „ Belohnung“ wird
Belohnungsmodell zu verwendet, um die Variablen
Trainieren. des Modells anzupassen.
19.05.2025 39
© Professur für Anwendungssysteme und E-Business
Instruktionen durch Prompts
• Prompt-Bestandteile
– Rolle „Du bist ein erfahrener Deutschlehrer…“
19.05.2025 40
© Professur für Anwendungssysteme und E-Business
Lernziele des Kapitels “Management von Daten”
19.05.2025 41
© Professur für Anwendungssysteme und E-Business