Datenmanagement: Unterschied zwischen den Versionen

aus GlossarWiki, der Glossar-Datenbank der Fachhochschule Augsburg
Zeile 37: Zeile 37:
sogenannten ''Daten'', d.h. als [[Zeichenkette]]n oder Bitfolgen modelliert.
sogenannten ''Daten'', d.h. als [[Zeichenkette]]n oder Bitfolgen modelliert.
Für gegebene Realitätsausschnitte können, um die Bedeutung von Daten
Für gegebene Realitätsausschnitte können, um die Bedeutung von Daten
festzulegen, so genannte [[Datenmodell]]e entwickelt werden.
festzulegen, so genannte [[Datenmodell]]e oder [[Datenschema]]ta entwickelt werden.


Damit ist es möglich, Wissen über die reale Welt dauerhaft auf [[Datenträger|digitalen Datenträgern]] zu speichern.
Damit ist es möglich, Wissen über die reale Welt dauerhaft auf [[Datenträger|digitalen Datenträgern]] zu speichern.
Das Datenmangement hat nun zur Aufgabe, gespeichertes Wissen bei Bedarf abrufen, neuen Gegebenheiten anpassen  
Das Datenmangement hat nun zur Aufgabe, gespeichertes Wissen bei Bedarf abrufen, neuen Gegebenheiten anpassen  
und – sobald es veraltet ist – auch wieder löschen zu können. Es gibt also vier fundamentale Operationen, die sogenannten CRUD-Operationen:
und – sobald es veraltet ist – auch wieder löschen zu können. Es gibt also vier fundamentale Operationen, die sogenannten [[CRUD]]-Operationen:


* '''C'''reate (Insert): Neue Daten erstellen.
* '''C'''reate (Insert): Neue Daten erstellen.
* '''R'''ead (Select, Retrieve. Search): Bestehende Daten selektieren und zur weiteren Verarbeitung bereit stellen.
* '''R'''ead (Select, Retrieve. Search): Bestehende Daten selektieren und zur weiteren Verarbeitung bereit stellen.
* '''U'''date (Modify): Bestehende Daten aktualisieren.
* '''U'''date (Modify): Bestehende Daten aktualisieren.
* '''D'''lete' (Destroy): Veraltete Daten löschen.
* '''D'''elete' (Destroy): Veraltete Daten löschen.
 
In der Datenbankwelt wird eine Sprache, die diese Operatonen unterstützt [[Data Manipulation Language]] (DML) genannt.
Bevor man jedoch DML-Operationen verwenden kann, muss man zunächst ein passendes Datenmodell definieren. Dies ist die
Aufgabe der [[Data Definition Language]] (DDL). Da sich auch das Datenschem in Laufe der Zeit ändern kann
– man schricht hier von [[Schemaevolution]] – benötigt man auch in der DDL CRUD-Operationen zum Erstellen, Aktualisieren und Löschen von Schemasprachen.
Die Selektion und Ausgabe von bestehenden Schemainformationen wird dagegen seltener benötigt und ist häufig nur systemspezifisch (proprietär) implementiert.


==Spezielle Begriffe des Datenmanagements (Kowarschick<ref name="MMDB-Vorlesung"/><ref name="MMDB-Skript">vgl. {{Quelle|Kowarschick (MMDB-Skript)}}</ref>)==
==Spezielle Begriffe des Datenmanagements (Kowarschick<ref name="MMDB-Vorlesung"/><ref name="MMDB-Skript">vgl. {{Quelle|Kowarschick (MMDB-Skript)}}</ref>)==

Version vom 30. April 2016, 10:45 Uhr

Dieser Artikel erfüllt die GlossarWiki-Qualitätsanforderungen nur teilweise:

Korrektheit: 3
(zu größeren Teilen überprüft)
Umfang: 1
(zu gering)
Quellenangaben: 2
(wichtige Quellen fehlen)
Quellenarten: 5
(ausgezeichnet)
Konformität: 5
(ausgezeichnet)

Definition (Kowarschick)[1]

Unter Datenmanagement versteht man die Verwaltung von Daten, d.h. die Konstruktion, Modifikation, Selektion, Präsentation und Destruktion von Daten und des zugrundeliegenden Datenmodells.

Bedeutung des Datenmanagements (vgl. Bayer (1996)[2])

Der Mensch kann die Welt/Realität nicht direkt erfassen. Er bildet letztlich immer (zumindest auf geistiger Ebene) Modelle der Realität. Neue Erkenntnisse kann er nur gewinnen, wenn er neue Fakten in seine Modellwelt einordnen oder die Modellwelt geeignet abändern kann.

Realitätsausschnitt Datenmodell Daten
Musik Notensystem Eine kleine Nachtmusik, Hänschen klein
Chemie Chemische Formeln $H_2O$, $CO_2$
Städte, Länder ... Landkarten Augsburger Stadtplan, Weltatlas
Sprache Bücher, Nachrichten, E-Mails

In der Mathematik und der Informatik wird die Realität ebenfalls auf abstrakte Modelle abgebildet, allerdings wesentlich formaler als dies mit natürlichen Sprachen möglich ist.

Fakten werden in der Informatik normalerweise in Form von sogenannten Daten, d.h. als Zeichenketten oder Bitfolgen modelliert. Für gegebene Realitätsausschnitte können, um die Bedeutung von Daten festzulegen, so genannte Datenmodelle oder Datenschemata entwickelt werden.

Damit ist es möglich, Wissen über die reale Welt dauerhaft auf digitalen Datenträgern zu speichern. Das Datenmangement hat nun zur Aufgabe, gespeichertes Wissen bei Bedarf abrufen, neuen Gegebenheiten anpassen und – sobald es veraltet ist – auch wieder löschen zu können. Es gibt also vier fundamentale Operationen, die sogenannten CRUD-Operationen:

  • Create (Insert): Neue Daten erstellen.
  • Read (Select, Retrieve. Search): Bestehende Daten selektieren und zur weiteren Verarbeitung bereit stellen.
  • Udate (Modify): Bestehende Daten aktualisieren.
  • Delete' (Destroy): Veraltete Daten löschen.

In der Datenbankwelt wird eine Sprache, die diese Operatonen unterstützt Data Manipulation Language (DML) genannt. Bevor man jedoch DML-Operationen verwenden kann, muss man zunächst ein passendes Datenmodell definieren. Dies ist die Aufgabe der Data Definition Language (DDL). Da sich auch das Datenschem in Laufe der Zeit ändern kann – man schricht hier von Schemaevolution – benötigt man auch in der DDL CRUD-Operationen zum Erstellen, Aktualisieren und Löschen von Schemasprachen. Die Selektion und Ausgabe von bestehenden Schemainformationen wird dagegen seltener benötigt und ist häufig nur systemspezifisch (proprietär) implementiert.

Spezielle Begriffe des Datenmanagements (Kowarschick[1][3])

Folgende Definitionen gelten für jede Art von Datenbanksystem:

Daten Repräsentation von „Elementen realen Welt“ gemäß einem zuvor definierten Datenmodell.
Datenmodell Abbildung der „realen Welt“ auf ein Modell, das von einem Menschen oder einem technischen System verarbeitet werden kann. Es legt fest, welche Arten von Daten es geben kann und in welchen Beziehungen diese stehen können.
Datenbank (DB) Ein Datenmodell zusammen mit einer Menge von zugehörigen Daten.
Datenbankmanagementsystem (DBMS) Ein informationstechnisches System zur Verwaltung von Datenbanken (im Sinnes des Datenmanagements).
Datenbanksystem (DBS) Ein aktives Datenbankmanagementsystem zusammen mit beliebig vielen (evtl. auch null) zugehörigen Datenbanken.

Für spezielle Datenbanksysteme kann man den Typ des DBS ergänzen: Relationales Datenmodell, Objektrelationale Datenbank, Objektorientiertes Datenbankmanagementsystem etc.

Für Content-Management-System werden in diesem Wiki analoge Begriffe verwendet:

Content Digitale Medien, d.h. strukturierte und/oder unstrukturierte, digitale Text-, Bild-, Video-, Audio-Dokumente etc.
Contentschema Abbildung der „realen Welt“ auf ein Modell, das von einem Content-Management-System verarbeitet werden kann. Es legt fest, welche Arten von Content es geben kann und in welchen Beziehungen diese stehen können.
Contentbase oder Contentbank (CB) Ein Contentschema zusammen mit zugehörigem Content.
Content-Management-System (CMS) Ein informationstechnisches System zur Verwaltung von Contentbanken (im Sinnes des Datenmanagements).
Content-System (CS) Ein aktives Content-Management-System zusammen mit beliebig vielen (evtl. auch null) zugehörigen Contentbanken.

Übersicht über verschiedene Arten von Datenmanagement

Datenmanagement Atomare Typen Aggregation unteschiedlicher Datentypen Aggregation gleichartiger Datentypen Datenmodell
Relationales Datenbankmanagement Zahlen, Zeichenketten, Boolean, Zeit, ... Tupel Relation/Tabelle Entity-Relationship-Modell
Obektorientiertes Datenmanagement Zahlen, Zeichenketten, Boolean ... Objekte Klassen (genauer: Klassenextensionen) UML: Klassendiagramm etc.
Content-Management Zahlen, Zeichenketten, Boolean, Zeit, ..., (digitale) Medien Hypermedium CMS-spezifisch
JSON Zahlen, Zeichenketten, Boolean Objekte Arrays JSON Schema, JSON Hyper-Schema
XML Zahlen, Zeichenketten, Boolean, Zeit Attribute oder alternativ XML-Elemente XML-Elemente XML Schema
Mengenlehre Boolean, leere Menge, evtl. Zahlen geordnete Paare/Tupel, Mengen und Klassen Relationen, Funktionen Formale Logik plus Axiome

Es gibt noch diveres weitere Datenmanagement-Technologieen: Netzwerk-Datenmanagement (z.B. Codasyl), Objektrelationales Datenmanagement, Graphenbasiertes Datenmanagement, NoSQL, ...

Quellen

  1. 1,0 1,1 Kowarschick (MMDB): Wolfgang Kowarschick; Vorlesung „Multimedia-Datenbanksysteme“; Hochschule: Hochschule Augsburg; Adresse: Augsburg; Web-Link; 2016; Quellengüte: 3 (Vorlesung)
  2. Bayer (1996): Rudolf Bayer; Vorlesung „Datenbanksysteme“; Hochschule: Technische Universität München; Adresse: München; 1996; Quellengüte: 3 (Vorlesung)
  3. vgl. Kowarschick (MMDB-Skript): Wolfgang Kowarschick; Vorlesung Multimedia-Datenbanksysteme – Sommersemester 2018; Hochschule: Hochschule Augsburg; Adresse: Augsburg; Web-Link; 2018; Quellengüte: 4 (Skript)