q2:das_relationenmodell

Im letzten Theorieteil wurde das ER-Modell als Hilfsmittel zum Erstellen einer Abstraktion der Realität vorgestellt und an Beispielen erläutert. Leider lassen sich so erstellte Konzepte nicht so ohne weiteres auf einem Rechner implementieren. Die klassischen DBMS-Systeme, die als Software auf Computern zur Verfügung stehen, beruhen alle auf Modellen, deren Ge¬stal-tungsmöglichkeit gegenüber dem ER-Modell weiter eingeschränkt ist. Man unter¬scheidet zwischen dem hierarchischen, dem Netzwerk- und dem Relationalen Modell. Das mit Abstand wichtigste ist das Relationale, bei uns kurz als R-Modell bezeichnet, deshalb soll es hier als einziges vorgestellt werden. es geht zurück auf Arbeiten von E.F. Codd Anfang der 70er Jahre. Auch ACCESS verwendet dieses Datenmodell (ebenso wie Dbase, MySql, Interbase, DB2, Oracle usw.), über die beiden anderen Konzepte kann man in der einschlägigen Literatur nachlesen. Im Moment werden neue Datenmodelle debattiert, die Schwächen dieser klassischen Modelle vermeiden und in ihrer Reichhaltigkeit das ER-Modell erreichen. Das wichtigste ist das soge-nannte Objektorientierte Modell, von dem es auch erste Realisierungen als DBMS gibt.

Eine Relationale Datenbank besteht aus einer oder mehreren Tabellen (zweidimensionalen Feldern in der Sprache der Informatik), wobei man die Spalten meist als Attribute oder Feldbezeichner tituliert, die Zeilen als Datensatz oder Entity. Die Namen lassen schon deutlich werden, dass es eine enge Beziehung zwischen ER- und R-Modell gibt. So würde der Entity-Typ „Kurs“ im großen Bsp. des letzten Theoriekapitels durch folgende Tabelle erfasst:

Kurs-NummerKurs-ThemaJahrgangsstufeTyp
11 Mechanik IE1 GK
12 Mechanik IE1 GK
3 DatenbankenQ2 GK
25 Short StoriesQ1 LK

Dabei wird einschränkend vorausgesetzt, dass jeder Eintrag für ein Attribut elementar ist, d.h. nicht aus Teilattributen zusammengesetzt ist und auch höchstens einen Wert umfassen kann. Sogenannte Nullwerte, d.h. kein zugeordneter Wert für einen Eintrag, sind möglich. Ein Bsp. wäre das Attribut Telefon-Nr bei einer Tabelle für Personendaten. Ein Leerlassen (Nulleintrag) bedeutet, dass die entsprechende Person kein Telefon hat oder die Nummer geheim bleiben soll. Tabellen, bei denen die Einträge elementar sind, werden als in 1. Normalform befindlich bezeichnet. Hier erkennt man sofort eine Einschränkung gegenüber dem ER-Modell, denn das Attribut Vorher besuchte Schuler des Entity-Typs Schüler kann so nicht in eine Tabelle umgesetzt werden, es sei denn, jeder Schüler hätte vorher nur eine einzige Schule besucht. Auch zusam-mengesetzte Attribute wie Adresse beim Typ Schüler kann man so nicht erfassen. Das letzte Problem lässt sich allerdings leicht lösen. Man nimmt einfach für jedes Teilattribut wie Postleitzahl, Wohnort, Straße mit Haus-Nr. eine eigene Spalte.

Jedes Attribut in einer Tabelle besitzt einen bestimmten vorbestimmten Wertebereich, z.B. Zeichenkette mit maximal 80 Zeichen oder Ganzzahl zwischen 0 und 255. Diese Wertebereiche werden oft als „domains“ bezeichnet.

Wie im ER-Modell definiert man Schlüssel. Ein Attribut oder eine Kombination von Attributen ist dann ein Schlüssel, wenn es keine zwei Entities in der Tabelle mit denselben Werten der Kombination gibt. Einer davon wird als Primärschlüssel ausgewählt. Mit Hilfe solcher Schlüssel werden Beziehungen zwischen verschiedenen Tabellen hergestellt. So könnten wir unsere Tabelle für Kurse um das Attribut Lehrer-Nr. er¬weitern, das einen Bezug zur Tabelle Lehrer schafft, die so aussehen könnte.

Lehrer-Nr. Name Vorname Titel
421 Müller Manfred StR
665 Maier Marlene OStR

Damit haben wir gleichzeitig die 1:n - Beziehung Lehrer - unterrichtet - Kurs im ER-Modell er¬fasst. Man bezeichnet die Lehrer-Nr in der Kurs-Tabelle als Fremdschlüssel.

Jetzt findet sich auch eine Lösung für das Problem mit dem Mehrfachattribut Vorher besuchte Schule. Es muss eine eigene Tabelle für Schulen erstellt werden, die eine Beziehung über Schüler-Nr. zur Tabelle LSchüler schafft.

Schüler-Nr. Schule
421 Grundschule Fuldatal
421 Gesamtschule Geistal
665 Integrierte Gesamtschule Obersuhl
665 Gesamtschule Obersberg

Einziger Schlüssel für diese Tabelle ist die Kombination Lehrer-Nr. - Fach.

Hier kann auch eine Lösung sinnvoll sein, die eine Tabelle Schule ohne Schülernummern verwendet, insbesondere, wenn man noch mehr Attribute über die Schulen speichern will und eine Beziehung zu den Schülern mit einer Zwischentabelle herstellt, wie es weiter unten erläutert wird.

Man erkennt, dass sich das ER-Bsp. in das R-Modell umsetzen lässt. Wir haben schon Mehrfach- und zusammengesetzte Attribute erledigt und 1:n - Beziehungen eingebaut (damit ist natürlich auch der Fall 1:1 erfasst). Es bleibt noch die Frage, wie man n:m - Beziehungen transformiert. Dazu betrachten wir im Bsp. die relationship besucht zwischen Schüler und Kurs. Weder die Hinzunahme eines Attributs Kurs-Nr. zu Schüler löst das Problem, denn ein Schüler besucht meist mehr als einen Kurs, noch die Hinzunahme der Schüler-Nr. zur Tabelle Kurs, da jeder Kurs von mehreren Schülern besucht wird. Es muss eine dritte Tabelle Kursbelegung her in der Form

Schüler-Nr. Kurs-Nr. Note Fehlstunden
7 12 12 0
8 11 4 14
9 11 9 2

Wie man sieht, lassen sich hier auch ohne Probleme die Attribute der Beziehung unterbringen. Schlüssel in dieser Tabelle ist die Kombination Schüler - Kurs-Nr.. Man spricht häufig von einer Zwischentabelle.

Wir versuchen jetzt, die allgemeinen Prinzipien einer Umsetzung vom ER-Modell ins R-Modell anzugeben:

Entitätstypen werden als Relationen dargestellt, bei der die Attribute in Klammern aufgezählt werden. Die Attribute des Primärschlüssels werden unterstrichen.

Beispiele für Relationen

Schüler(Schülernummer, Name, Vorname, StrasseNr, PLZOrt, Geburtsdatum)
Kurs(Kursnummer, Thema, Art, Halbjahr)

In relationalen Datenbanksystemen wie z.B. MySQL, Access oder Paradox werden auch Beziehungen auf Relationen abgebildet. Dabei gilt folgende

Jede ER-Beziehung wird auf eine Relation abgebildet. Die Relation besteht aus den Primärschlüsseln der beteiligten Entitätstypen sowie den Attributen der Beziehung. 1:1 - und 1:n - Beziehungen lassen sich allerdings durch zusätzliche Attribute in einer Tabelle erfassen. Dabei wird der Schlüssel der 1-Tabelle ein zusätzliches Attribut in der n-Tabelle. (vgl: Optimierung)

Beispiel

Die ER-Beziehung Schüler belegt Kurs wird auf die Relation

Belegt(↑Schülernummer, ↑Kursnummer, Punkte) abgebildet.

Der Primärschlüssel dieser Relation besteht aus den beiden Primärschlüsseln der Entitätstypen. Im Falle von 1:n bzw. 1:1-Beziehungen genügt ein Primärschlüssel als Primärschlüssel der Relation. Bei 1:n-Beziehungen ist dies der Primärschlüssel der n-Seite. Die Primärschlüssel Schülernummer und Kursnummer sind nur zusammen genommen Primärschlüssel für die Relation belegt. Jeder der beiden Primärschlüssel ist für sich genommen ein sogenannter Fremdschlüssel, also ein Schlüssel in einer fremden Relation. Fremdschlüssel kennzeichnen wir mit einem Pfeil ↑, der dem Fremdschlüsselattribut voran gestellt wird.

Die Grundregel kann immer angewendet werden. Sie liefert unabhängig von der Kardinalität der Beziehung stets drei Relationen bei der Abbildung einer ER-Beziehung: je eine für die beiden beteiligten Entitätstypen und eine für die Beziehung.

Es gibt viele Fälle, in denen man mit weniger Relationen auskommt. Diese Fälle können bei 1:1 und 1:n-Beziehungen auftreten, aber nicht bei n:m-Beziehungen. Anhand von zwei Aufgaben betrachten wir Möglichkeiten Relationen und damit Tabellen beim Abbilden von ER-Beziehungen einzusparen.

Die beiden 1:n-Beziehungen unterscheiden sich hinsichtlich der Optionalität: jeder Schüler hat einen Tutor, aber nicht jedes Buch muss ausgeliehen sein. Im ersten Fall handelt es sich um eine obligatorische (muss) Beziehung, im zweiten um eine optionale (kann) Beziehung. Bei einer obligatorischen Beziehung gibt es keine sonderlichen Probleme, wenn drei Relationen zu zwei Relationen zusammengefasst werden.

Eine auf der n-Seite obligatorische ER-Beziehung der Kardinalität 1:n kann auf zwei Relationen abgebildet werden. Die Relation der n-Seite wird dazu um den Primärschlüssel der 1-Seite ergänzt.

Die beiden Grundregeln liefern diese drei Relationen:

Schüler(SNr, Nachname, Vorname, StraßeNr, PLZ, Ort)
Tutor(Kürzel, Nachname, Vorname, Dienstbezeichnung)
hatTutor(↑SNr, ↑Kürzel)

Zur Optimierung integrieren wir den Primärschlüssel Kürzel der 1-Seite als Fremdschlüssel in die n-Seite. Dadurch wird eine Realtion eingespart.

Schüler(SNr, Nachname, Vorname, StraßeNr, PLZ, Ort, ↑Kürzel)
Tutor(Kürzel, Nachname, Vorname, Dienstbezeichnung)

Beim zweiten Beispiel treten Nullwerte auf, wenn man die Beziehungsrelation in die Relation der n-Seite integriert.

Bei einem nicht ausgeliehenden Buch bleibt der Fremdschlüssel Schülernummer leer. Man spricht in der Fachsprache von einem Nullwert. Das Attribut hat dann den Wert NULL. Sind viele Bücher da und nur wenige Bücher ausgeliehen, wird unnötig viel Speicherplatz für den zusätzlichen Fremdschlüssel verbraucht. Daher benutzen wir die folgende Regel:

Eine auf der n-Seite optionale ER-Beziehung der Kardinalität 1:n wird auf zwei Relationen abgebildet, wenn die meisten Entitäten der n-Seite mit einer Entität der 1-Seite in Beziehung stehen. Ansonsten wird die ER-Beziehung gemäß den beiden Grundregeln auf drei Relationen abgebildet.

Wir betrachten die ER-Beziehung Schüler hat Spind.

Nach der Grundregel wird dieses ER-Diagramm auf drei Relationen abgebildet:

Schüler(SNummer, Name, Vorname)
hat(↑SNummer, ↑Nummer)
Spind(Nummer, Standort, Größe)

Lässt sich das Relationenmodell vereinfachen? Wir betrachten dazu vier unterschiedliche Fälle.

Fall A: Spinde an der Modellschuleschule

An der Modellschuleschule können Spinde von Schülern gemietet werden. Die Vertragsfirma hat so viele Spinde aufgestellt, wie Mietverträge abgeschlossen wurden. Jeder Spind gehört also zu einem Schüler, aber nicht jeder Schüler hat einen Spind. Die Beziehung ist also auf der Spind-Seite obligatorisch, weswegen die hat-Beziehung in die Spind-Seite integriert werden kann, ohne dass Nullwerte auftreten. Es reichen zwei Relationen aus:

Schüler(SNummer, Name, Vorname)
Spind(Nummer, Standort, Größe, ↑SNummer)

Fall B: Spinde an einer amerikanischen Schule

An einer amerikanischen Schule hat jeder Schüler einen Spind, wegen der ständigen Fluktuation in der Schülerpopulation gibt es einige Spinde in Reserve. Jeder Schüler hat einen Spind, aber nicht jeder Spind ist genutzt. Die Beziehung ist also auf der Schüler-Seite obligatorisch und auf der Spind-Seite optional. Die hat-Beziehung kann in die Schüler-Relation integriert werden, ohne dass Nullwerte auftreten. Es reichen zwei Relationen aus:

Schüler(SNummer, Name, Vorname, ↑Nummer)
Spind(Nummer, Standort, Größe)

Fall C: Spinde beim Bund

In einer Kaserne werden die Zimmer mit Rekruten voll belegt. Für jeden Rekruten gibt es genau einen Spind auf dem Zimmer. Die Rekrut-hat-Spind-Beziehung ist also auf beiden Seiten obligatorisch. In diesem Fall kommt man mit einer einzigen Relation aus:

Rekrut(SNummer, Name, Vorname, Nummer, Standort, Größe)

Allerdings entspricht diese Relation nicht der 3. Normalform.

Fall D: Spinde im Schwimmbad

Gehen Schüler im Sommer ins Schwimmbad, so können sie einen Spind belegen. Bei kühler Witterung sind sicherlich nicht alle Spinde belegt. Die Schüler-Spind-Beziehung ist also auf beiden Seiten optional. Obwohl eine 1:1-Beziehung vorliegt, wird in diesem Fall nur dann eine Reduktion auf zwei Relationen vorgenommen, wenn die meisten Spinde belegt sind.

Eine ER-Beziehung der Kardinalität 1:1 kann auf eine Relation abgebildet werden, wenn sie auf beiden Seiten obligatorisch ist. Ist sie nur auf einer Seite obligatorisch so kann die aus der Grundregel kommende Beziehungsrelation in die Relation der obligatorischen Seite integriert werden. Ist die Beziehung auf beiden Seiten optional, so wird eine Reduktion auf zwei Relationen nur dann durchgeführt, wenn die meisten Entitäten der einen Seite mit der der anderen Seite verbunden sind.

Wird zwecks Optimierung ein Primärschlüssel der Relation R1 als Fremdschlüssel in die Relation R2 aufgenommen, so tritt ein Namenskonflikt auf, wenn der Fremdschlüssel den gleichen Namen wie ein Attribut der Relation R2 hat.

Im Beispiel Schulamt kommen diese beiden Relationen vor:

Schule(Name, PLZ, Landkreis, Straße, Hausnummer, Telefonnummer, Schüleranzahl) Klasse(Name, Schülerzahl)

Die 1:n-Beziehung Klasse gehört zu Schule wird durch Hinzunahme des Primärschlüssels Name in die Relation Klasse abgebildet, wodurch der Namenskonflikt bei den Name-Attributen entsteht.

Schule(Name, PLZ, Landkreis, Straße, Hausnummer, Telefonnummer, Schüleranzahl) Klasse(Name, Schülerzahl, ↑Name) ← Namenskonflikt

Ein Namenskonflikt wird dadurch aufgelöst, dass man den Fremdschlüssel geeignet umbenennt, am besten durch Hinzunahme des Namens der Relation. Im Beispiel nennt man demgemäß den Fremdschlüssel Name in Schulname um.

  • /var/www/infowiki/data/pages/q2/das_relationenmodell.txt
  • Zuletzt geändert: 2017/07/14 18:54
  • von admin03