Kofler | Datenbanksysteme | E-Book | www.sack.de
E-Book

E-Book, Deutsch, 782 Seiten

Reihe: Rheinwerk Computing

Kofler Datenbanksysteme

Das umfassende Lehrbuch
2. Auflage 2024
ISBN: 978-3-367-10017-0
Verlag: Rheinwerk
Format: EPUB
Kopierschutz: 0 - No protection

Das umfassende Lehrbuch

E-Book, Deutsch, 782 Seiten

Reihe: Rheinwerk Computing

ISBN: 978-3-367-10017-0
Verlag: Rheinwerk
Format: EPUB
Kopierschutz: 0 - No protection



Das Handbuch für gutes Datenbankdesign

Datenbanken sind das Rückgrat moderner IT-Systeme. Wie Sie sicher mit ihnen arbeiten, zeigt Ihnen Dr. Michael Kofler in diesem umfassenden Lehrbuch . Sie lernen grundlegende Begriffe und Konzepte kennen, die Sie für gutes Datenbankdesign brauchen, und erfahren, wie Daten modelliert und strukturiert werden. Ein Schnellkurs in SQL zeigt Ihnen, wie Daten abgefragt und geändert werden, Praxiswissen zur Client-Entwicklung und DBMS-Administration machen Sie fit für den Berufsalltag, Übungen und anschauliche Beispiele helfen Ihnen beim Selbststudium und der Prüfungsvorbereitung.

Neu in der 2. Auflage: MongoDB und NoSQL in der Praxis.

  • Systematische Einführung in SQL, ACID, Entity-Relationships, Datenbankentwicklung und -Administration
  • Relationale Datenbanken verstehen und anwenden
  • Mit Übungen und Musterlösungen zum Selbststudium

Aus dem Inhalt:

  • Datenbankmodellierung: vom ER-Modell zum perfekten Schema
  • Datentypen
  • Primary Keys, Foreign Keys und referenzielle Integrität
  • Indizes
  • Daten mit SQL abfragen und ändern
  • SQL für Fortgeschrittene: Subqueries, Transaktionen, Rekursion, DDL
  • Client-Programmierung
  • Benutzerverwaltung und Access Control
  • Backups und Logging
  • Replikation und High Availability
  • Stored Procedures und Trigger
  • NoSQL: Datenverarbeitung jenseits relationaler Datenbanken
Kofler Datenbanksysteme jetzt bestellen!

Autoren/Hrsg.


Weitere Infos & Material


  Materialien zum Buch ... 12

  Vorwort ... 13

TEIL I.  Grundlagen ... 17

  1.  Wozu Datenbanken? ... 19


       1.1 ... Datenbanken sind allgegenwärtig ... 19

       1.2 ... Warum eine Excel-Tabelle nicht ausreicht ... 24

       1.3 ... Die erste eigene Datenbank ... 27

       1.4 ... Realisierung des Beispiels mit der MySQL Workbench ... 35

  2.  Grundlagen relationaler Datenbanken ... 47


       2.1 ... Datenbank versus Datenbankmanagementsystem ... 47

       2.2 ... Das relationale Modell ... 56

       2.3 ... Transaktionen ... 65

       2.4 ... Datensicherheit und ACID ... 68

       2.5 ... Codds zwölf Gebote ... 78

       2.6 ... Kritik am relationalen Modell ... 81

       2.7 ... Wiederholungsfragen ... 86

TEIL II.  Datenbanken modellieren ... 91

  3.  Datenbankmodellierung ... 93


       3.1 ... Datenbankschema ... 94

       3.2 ... Modellierungsstufen ... 96

       3.3 ... Modellierungstechniken ... 100

       3.4 ... Das Entity-Relationship-Modell ... 104

       3.5 ... Sonderfälle im ER-Modell ... 110

       3.6 ... Alternative Diagrammformen und Notationen (IDEF1X, Min-Max, UML) ... 118

       3.7 ... Vom ER-Diagramm zum Tabellenschema ... 129

       3.8 ... Namensregeln ... 137

       3.9 ... Normalformen ... 142

       3.10 ... Normalisierungsbeispiel ... 154

       3.11 ... Modellierung hierarchischer bzw. unstrukturierter Daten ... 157

       3.12 ... Wiederholungsfragen ... 164

  4.  Datentypen ... 169


       4.1 ... SQL und das Kommando »CREATE TABLE« ... 169

       4.2 ... Ganze Zahlen ... 172

       4.3 ... Gleit- und Festkommazahlen ... 174

       4.4 ... Zeichenketten ... 178

       4.5 ... Datum und Uhrzeit ... 183

       4.6 ... Boolesche Zustände ... 184

       4.7 ... Binäre Daten (BLOBs) ... 185

       4.8 ... NULL, Defaultwerte und Werteinschränkungen (CHECKs) ... 188

       4.9 ... Besondere Datentypen ... 191

       4.10 ... Eigene Datentypen ... 195

       4.11 ... Virtuelle Spalten (Generated Columns) ... 197

       4.12 ... Beispiele ... 198

       4.13 ... Wiederholungsfragen ... 200

  5.  Primary Keys, Foreign Keys und referenzielle Integrität ... 203


       5.1 ... Primary Keys (Primärschlüssel) ... 204

       5.2 ... Foreign Keys (Fremdschlüssel) ... 217

       5.3 ... Foreign-Key-Beispiele ... 225

       5.4 ... Wiederholungsfragen ... 232

  6.  Indizes ... 235


       6.1 ... Indexformen ... 236

       6.2 ... Index-Interna und B-Trees ... 242

       6.3 ... Indizes -- Pro und Kontra ... 257

       6.4 ... Cache-Systeme für Abfragen ... 260

       6.5 ... Wiederholungsfragen ... 262

  7.  Physische Modellierung ... 265


       7.1 ... DBMS-Auswahl ... 265

       7.2 ... Dimensionierung von Datenbanken ... 269

       7.3 ... Views ... 274

       7.4 ... Partitionen ... 281

       7.5 ... Wiederholungsfragen ... 286

  8.  Modellierungsbeispiele ... 289


       8.1 ... »books«-Datenbank ... 290

       8.2 ... »todo«-Datenbank ... 292

       8.3 ... »school«-Datenbank ... 301

       8.4 ... »clouddb«-Datenbank ... 312

       8.5 ... »sakila«-Datenbank ... 323

       8.6 ... »employees«-Datenbank ... 329

       8.7 ... Noch mehr Musterdatenbanken ... 332

       8.8 ... Wiederholungsfragen ... 334

TEIL III.  Structured Query Language (SQL) ... 337

  9.  Relationale Algebra und SQL ... 339


       9.1 ... Relationale Algebra ... 340

       9.2 ... Relationenkalkül (relationaler Calculus) ... 350

       9.3 ... Structured Query Language (SQL) ... 355

       9.4 ... Elementare SQL-Syntaxregeln ... 360

       9.5 ... Wiederholungsaufgaben ... 362

10.  Daten abfragen (SELECT) ... 365


       10.1 ... Zugriff auf die Beispieldatenbanken ... 365

       10.2 ... Einfache Abfragen (WHERE, DISTINCT) ... 368

       10.3 ... Tabellen verknüpfen (JOIN) ... 373

       10.4 ... Ergebnisse gruppieren (GROUP BY) ... 385

       10.5 ... Ergebnisse sortieren (ORDER BY) ... 389

       10.6 ... Ergebnisse limitieren (LIMIT) ... 390

       10.7 ... SELECT-Syntax-Zusammenfassung ... 392

       10.8 ... Der Umgang mit NULL ... 393

       10.9 ... Abfragen kombinieren (UNION) ... 395

       10.10 ... Abfrageausführung und -optimierung ... 396

       10.11 ... Wiederholungsaufgaben ... 407

11.  Daten ändern (INSERT, UPDATE, DELETE) ... 411


       11.1 ... Daten einfügen (INSERT) ... 412

       11.2 ... Daten ändern (UPDATE) ... 417

       11.3 ... Daten löschen (DELETE) ... 421

       11.4 ... Wiederholungsaufgaben ... 424

12.  Transaktionen ... 425


       12.1 ... Transaktionen in SQL ... 426

       12.2 ... Isolation Level ... 429

       12.3 ... Dirty Read, Phantom Read und andere Isolation-Probleme ... 435

       12.4 ... Locking-Verfahren ... 446

       12.5 ... Multiversion Concurrency Control (MVCC) ... 453

       12.6 ... Wiederholungsaufgaben ... 458

13.  Subqueries, Rekursion, Zusatzfunktionen ... 461


       13.1 ... SQL-Funktionen ... 461

       13.2 ... Subqueries ... 468

       13.3 ... Window-Funktionen (OVER) ... 474

       13.4 ... Rekursion ... 479

       13.5 ... Data Definition Language (DDL) ... 484

       13.6 ... Systemkatalog ... 489

       13.7 ... Wiederholungsaufgaben ... 494

14.  Volltextsuche, geografische Daten, XML und JSON ... 495


       14.1 ... Volltextindex und Volltextsuche ... 495

       14.2 ... Geografische Daten (GIS-Funktionen) ... 500

       14.3 ... XML ... 506

       14.4 ... JSON ... 512

       14.5 ... Wiederholungsaufgaben ... 515

TEIL IV.  Administration und Programmierung ... 517

15.  Benutzerverwaltung ... 519


       15.1 ... Authentifizierung ... 520

       15.2 ... Privilegien und Rollen ... 522

       15.3 ... Administration der Benutzerrechte (DCL) ... 526

       15.4 ... Ein Blick hinter die Kulissen ... 532

       15.5 ... Server-Konfiguration und -Absicherung ... 534

16.  Logging und Backups ... 539


       16.1 ... Logging ... 539

       16.2 ... Backups ... 543

       16.3 ... Import und Export ... 551

17.  Replikation und High Availability ... 555


       17.1 ... Replikation ... 555

       17.2 ... Replikations-Setup in MySQL ... 562

       17.3 ... High Availability ... 566

18.  Stored Procedures und Trigger ... 567


       18.1 ... Programmierung auf DBMS-Ebene versus Client-Code ... 567

       18.2 ... Hello, Stored Procedure! ... 570

       18.3 ... Stored Procedures und Funktionen ... 575

       18.4 ... Fehlerabsicherung und Cursor ... 583

       18.5 ... Administration und Sicherheit ... 587

       18.6 ... Trigger ... 589

19.  Client-Programmierung ... 591


       19.1 ... Konzepte der Client-Programmierung ... 591

       19.2 ... Beispiel 1: Java und JDBC ... 596

       19.3 ... Beispiel 2: Kotlin und Exposed ... 600

TEIL V.  NoSQL ... 607

20.  Von relationalen Datenbanken zu NoSQL ... 609


       20.1 ... Verteilte Datenbankmanagementsysteme ... 610

       20.2 ... Objektorientierte Datenbanken ... 619

       20.3 ... Online Analytical Processing (OLAP) ... 625

       20.4 ... NoSQL ... 633

       20.5 ... Wiederholungsfragen ... 648

21.  MongoDB ... 651


       21.1 ... Installation ... 651

       21.2 ... Abfragen durchführen ... 656

       21.3 ... Nicht relationales Datenbankdesign ... 662

       21.4 ... »todo«-Datenbank ... 665

  Anhang ... 669

  A.  MySQL installieren und einrichten ... 669


       A.1 ... MySQL Workbench ... 670

       A.2 ... Onlinezugriff auf die Beispieldatenbanken ... 672

       A.3 ... MySQL-Server unter Windows installieren ... 673

       A.4 ... MySQL-Server unter macOS installieren ... 676

       A.5 ... MySQL-Server unter Linux installieren ... 677

       A.6 ... Der Kommando-Client mysql ... 679

       A.7 ... Die MySQL-Shell mysqlsh ... 683

       A.8 ... Beispieldatenbanken lokal installieren ... 685

       A.9 ... Server-Konfiguration für den Unterricht ... 686

  B.  Lösungen ... 691


       B.1 ... Kapitel 2: »Grundlagen relationaler Datenbanken« ... 691

       B.2 ... Kapitel 3: »Datenbankmodellierung« ... 699

       B.3 ... Kapitel 4: »Datentypen« ... 711

       B.4 ... Kapitel 5: »Primary Keys, Foreign Keys und referenzielle Integrität« ... 714

       B.5 ... Kapitel 6: »Indizes« ... 720

       B.6 ... Kapitel 7: »Physische Modellierung« ... 726

       B.7 ... Kapitel 8: »Modellierungsbeispiele« ... 729

       B.8 ... Kapitel 9: »Relationale Algebra und SQL« ... 738

       B.9 ... Kapitel 10: »Daten abfragen (SELECT)« ... 741

       B.10 ... Kapitel 11: »Daten ändern (INSERT, UPDATE, DELETE)« ... 747

       B.11 ... Kapitel 12: »Transaktionen« ... 750

       B.12 ... Kapitel 13: »Subqueries, Rekursion, Zusatzfunktionen« ... 753

       B.13 ... Kapitel 14: »Volltextsuche, geografische Daten, XML und JSON« ... 759

       B.14 ... Kapitel 20: »Von relationalen Datenbanken zu NoSQL« ... 760

  Index ... 769


Vorwort


»Geld regiert die Welt.«
»Das Internet regiert die Welt.«
»Datenbanken regieren die Welt.«

Natürlich sind alle drei Aussagen irgendwie richtig, aber an dieser Stelle ist nur der dritte Aspekt relevant. Tatsächlich sind Datenbanken in unserem Leben allgegenwärtig: Jede Suche im Internet, jeder Einkauf in einem Onlineshop, jede medizinische Untersuchung, jeder Eintritt in ein Konzert, jede Fahrt in einem Skigebiet, jeder Aufenthalt in einer Parkgarage, jede bestandene oder missglückte Prüfung während des Studiums hinterlässt Einträge (Datensätze) in einer Datenbank.

In diesem Buch beginne ich damit, Ihnen die Grundlagen und Funktionsweise von Datenbankmanagementsystemen zu erklären. Dieser sperrige Begriff bezeichnet Programme, die Datenbanken speichern – z. B. Oracle Database Server, Microsoft SQL Server oder MySQL. Diese drei Programme sind Vertreter aus der Gruppe relationaler Datenbankmanagementsysteme. Solche Systeme garantieren die Sicherheit und die Konsistenz von Daten auch beim gleichzeitigen Zugriff durch mehrere Programme oder Clients. Im Detail werden diese Sicherheitsanforderungen durch die Begriffe Atomicity, Consistency, Isolation und Durability umschrieben (zusammen kurz ACID).

Ein Grundkonzept relationaler Datenbanken besteht darin, dass Datensätze unterschiedlicher Tabellen aufeinander verweisen. Das ermöglicht eine gut strukturierte Abbildung komplexer Daten ohne Redundanz. Ein inhaltlicher Schwerpunkt dieses Buchs liegt auf dem optimalen Design relationaler Datenbanken. Das richtige Design hat großen Einfluss darauf, wie gut sich die Daten später durchsuchen lassen und wie effizient Datenbankanwendungen laufen. Fehler in der Designphase können später kaum mehr korrigiert werden.

Bei der Nutzung von Datenbanken tritt die Structured Query Language (SQL) in den Vordergrund. Damit formulieren Sie Kommandos, um nach Daten zu suchen (SELECT), um diese zu ändern (INSERT, UPDATE und DELETE) sowie um diverse andere Aktionen durchzuführen – beispielsweise Kommandos, die Transaktionen bündeln, neue Tabellen einrichten oder Benutzer-Accounts anlegen. In mehreren Kapiteln erläutere ich die relationale Algebra, die als wissenschaftliche Grundlage von SQL gilt, sowie die vielfältigen Anwendungsformen von SQL. Dabei gehe ich auch auf neue Entwicklungen und Randbereiche ein, z. B. auf die Formulierung rekursiver Abfragen, auf die Verarbeitung geografischer Daten oder auf den Umgang mit XML- und JSON-Dokumenten.

Mit dem Datenbankentwurf und dem Ausführen von SQL-Kommandos ist es nicht getan: Administratoren müssen sich um einen anhaltend sicheren Betrieb kümmern, Benutzer-Accounts einrichten, Backups durchführen und vielleicht ein Replikationssystem konfigurieren. In der Programmierung sind Sie für die Entwicklung von Desktop-Programmen, Weboberflächen oder Apps zuständig, die die Anwendung von Datenbanken so einfach wie möglich machen. Stored Procedures können dabei helfen, dass innerhalb der Datenbank stets bestimmte Regeln (die sogenannte Geschäftslogik) eingehalten werden. Auf all diese Aspekte gehe ich im vierten Teil dieses Buchs kurz ein, um so die ganze Bandbreite der Anwendung von Datenbankmanagementsystemen zu beleuchten.

Das relationale Modell gilt zwar seit über 30 Jahren als Industriestandard – aber es ist nicht frei von Einschränkungen und Nachteilen. Problematisch ist vor allem die mangelhafte Skalierbarkeit für extrem große Datenbanken. Deswegen hat sich in den letzten Jahren in der Datenbankwelt eine Art Gegenbewegung unter dem Sammelbegriff NoSQL etabliert. In einem eigenen Kapitel gehe ich darauf ein, durch welche Merkmale sich NoSQL-Systeme von ihren relationalen Vorgängern absetzen und unter welchen Umständen ihr Einsatz zweckmäßig ist. Ein weiteres Kapitel (neu in der 2. Auflage) zeigt anhand von MongoDB die praktische Anwendung eines NoSQL-Systems.

Viel Erfolg!


Mit diesem Buch richte ich mich an alle, die den Umgang mit Datenbanken bzw. mit Datenbankmanagementsystemen lernen und vor allem verstehen möchten. Das Buch ist als Begleitlektüre zum Datenbankunterricht in der IT-Ausbildung konzipiert, eignet sich aber auch für das Selbststudium.

Besonders wichtig war es mir, bei aller notwendigen Theorie möglichst viel Praxis einfließen zu lassen, um Ihnen das Rüstzeug für reale Projekte zu geben. Dementsprechend breit ist die Palette der im Buch präsentierten Beispiele. Viele Kapitel enden mit (oft umfangreichen) Übungs- und Wiederholungsaufgaben, deren Lösungen Sie im Anhang finden.

Ich wünsche Ihnen viel Erfolg beim Erlernen der Datenbanktheorie und bei der praktischen Anwendung dieses Wissens!

Michael Kofler (https://kofler.info)

PS: Bedanken möchte ich mich an dieser Stelle bei Prof. Thomas Eppler, bei Holger Jakobs und bei Stefan Pröll, die mir eine Menge wertvolles Feedback zum Manuskript gegeben haben.

Die Rolle von MySQL in diesem Buch


Es ist möglich, Datenbanktheorie quasi in den luftleeren Raum hinein zu vermitteln. Davon halte ich aber nichts. Damit Sie lernen, mit Datenbanken umzugehen, müssen Sie eigene Datenbanken entwerfen, mit Daten füllen und Abfragen für diese Daten testen. Deswegen sollte Ihnen bei der Lektüre dieses Buchs ein Database Management System (DBMS) zur Verfügung stehen, um die vielen in diesem Buch präsentierten Beispiele selbst auszuprobieren.

Für dieses Buch habe ich mich für MySQL als Arbeitsumgebung entschieden. Für das Open-Source-Programm sprechen einige Argumente:

  • Der Datenbank-Server ist inklusive des hervorragenden Administrationswerkzeugs MySQL Workbench kostenlos für alle gängigen Plattformen verfügbar (Windows, macOS, Linux).

  • MySQL ist sehr weit verbreitet und bildet für viele Websites das Datenbankfundament. MySQL-Kenntnisse sind also für Ihre weitere berufliche Arbeit vorteilhaft.

  • MySQL ist gut dokumentiert.

Wie Sie den MySQL-Server und die MySQL Workbench auf Ihrem Rechner installieren und einige Musterdatenbanken einrichten, beschreibe ich im Anhang. Als zusätzlichen Service ermögliche ich Ihnen den Zugriff auf einige Musterdatenbanken direkt über das Internet. Damit können Sie ohne eine eigene Server-Installation SQL-Abfragen ausprobieren. (Ganz ersetzt dieser Service eine eigene Installation aber nicht: Sie können damit keine Daten ändern, keine eigenen Datenbanken einrichten und auch keine administrativen Funktionen ausprobieren.)

MySQL versus MariaDB


Nachdem MySQL von Oracle übernommen wurde, haben ehemalige MySQL-Entwickler das Projekt MariaDB gestartet. Das Ergebnis ist ein weitgehend kompatibler Datenbank-Server mit ein wenig abweichenden Lizenzbestimmungen. In meinem beruflichen Umfeld arbeite ich häufig mit MariaDB unter Linux.

Für dieses Buch habe ich mich aber ganz pragmatisch auf MySQL festgelegt. Im Vordergrund des Buchs stehen Datenbankgrundlagen. Es fehlt der Platz, um auf die kleinen Unterschiede zwischen MySQL und MariaDB einzugehen. Durch die Beschränkung auf ein Programm bleiben Installationsanleitungen, der Umgang mit Beispielen usw. übersichtlicher.

Wenn Sie schon mit MariaDB vertraut sind, können Sie dieses DBMS selbstverständlich auf Ihrem Testrechner verwenden. Fast alle in diesem Buch präsentierten Beispiele funktionieren auch dort.

Glossar


In diesem Buch kommen einige Abkürzungen immer wieder vor, ohne dass ich sie jedes Mal neu erläutere.

Kürzel

Bedeutung

ACID

Atomicity, Consistency, Isolation und Durability

API

Application Programming Interface (Programmierschnittstelle)

DB

Database

DBMS

Database Management System

ER-Modell

Entity-Relationship-Modell

FK

...


Kofler, Michael
Michael Kofler hat Telematik an der TU Graz studiert und ist einer der erfolgreichsten deutschsprachigen IT-Fachbuchautoren. Zu seinen Themengebieten zählen neben Linux auch IT-Sicherheit, Python, Swift, Java und der Raspberry Pi. Er ist Entwickler, berät Firmen undarbeitet als Lehrbeauftragter.



Ihre Fragen, Wünsche oder Anmerkungen
Vorname*
Nachname*
Ihre E-Mail-Adresse*
Kundennr.
Ihre Nachricht*
Lediglich mit * gekennzeichnete Felder sind Pflichtfelder.
Wenn Sie die im Kontaktformular eingegebenen Daten durch Klick auf den nachfolgenden Button übersenden, erklären Sie sich damit einverstanden, dass wir Ihr Angaben für die Beantwortung Ihrer Anfrage verwenden. Selbstverständlich werden Ihre Daten vertraulich behandelt und nicht an Dritte weitergegeben. Sie können der Verwendung Ihrer Daten jederzeit widersprechen. Das Datenhandling bei Sack Fachmedien erklären wir Ihnen in unserer Datenschutzerklärung.