DRBD ist ein Linux Kernelmodul, welches eine zusätzliche Schicht zwischen einem Blockgerät (Festplatte) und dem Dateisystem implementiert. Für das Dateisystem spielt es keine Rolle, ob das Gerät auf dem es sich befindet, eine Festplatte oder ein DRBD ist. Für alle Anwendungen ist das DRBD transparent(nicht sichtbar). Bei jedem Zugriff auf das DBRD werden die geschriebenen Blöcke via TCP/IP auf einen zweiten Server repliziert. Zusätzlich werden Metadaten aller Blöcke des DRBD gespeichert, die den Zustand gegenüber dem zweiten Server enthalten(gleich/ungleich). Nach Rückmeldung des zweiten Servers, dass der geänderte Block ebenfalls geschrieben wurde, wird in den Metadaten dieses Ergebnis gespeichert und das Gerät ist wieder konsistent. Bei einem Ausfall des zweiten Servers sind alle geänderten Blöcke in den Metadaten als nicht repliziert markiert. Sobald der zweite Server wieder zur Verfügung steht, werden nur die Blöcke an den zweiten Server übertragen, die auf den beiden Servern unterschiedlich sind. Das geschieht durch den Vergleich der Metadaten.
Hochverfügbarkeit bezeichnet die Fähigkeit eines Systems, bei Ausfall einer seiner Komponenten einen uneingeschränkten Betrieb zu gewährleisten.
99% ≡ 3,7 Tage/Jahr (AEC-0)
99,9% ≡ 8,76 Stunden/Jahr (AEC-1)
99,99% ≡ 52,6 Minuten/Jahr (AEC-2)
99,999% ≡ 5,26 Minuten/Jahr (AEC-3)
99,9999% ≡ 32 Sekunden/Jahr (AEC-4)
99,99999% ≡ 3 Sekunden/Jahr (AEC-5)
Die Harvard Research Group (HRG) teilt Hochverfügbarkeit in ihrer Availability Environment Classification (kurz: AEC 0-5) in 6 Klassen ein
HRG-Klasse |
Bezeichnung |
Erklärung |
---|---|---|
AEC-0 |
Conventional |
Funktion kann unterbrochen werden, Datenintegrität ist nicht essentiell. |
AEC-1 |
Highly Reliable |
Funktion kann unterbrochen werden, Datenintegrität muss jedoch gewährleistet sein. |
AEC-2 |
High Availability |
Funktion darf nur innerhalb festgelegter Zeiten oder zur Hauptbetriebszeit minimal unterbrochen werden. |
AEC-3 |
Fault Resilient |
Funktion muss innerhalb festgelegter Zeiten oder während der Hauptbetriebszeit ununterbrochen aufrechterhalten werden. |
AEC-4 |
Fault Tolerant |
Funktion muss ununterbrochen aufrechterhalten werden, 24*7 Betrieb (24 Stunden, 7 Tage die Woche) muss gewährleistet sein. |
AEC-5 |
Disaster Tolerant |
Funktion muss unter allen Umständen verfügbar sein. |
Cluster = logischer Verbund von physikalischen Einheiten
Kopplung von zwei oder mehr Systemen
sofortiges Replizieren auf Blockebene bei jedem Schreibvorgang
Beim Ausfall der Hartbeat-Kommunikation wird angenommen, dass das primäre System nicht mehr zur Verfügung steht und die konfigurierten Dienste werden dann auf dem sekundären System gestartet. Das sekundäre System übernimmt die Arbeit und wird zum primären System.
Ab Version 8 von DRBD ist ein Multi-Primary Betrieb möglich
Replikation ist die mehrfache Speicherung von Daten an typischerweise unterschiedlichen Standorten(Kopie) und deren Abgleich bei Änderung. Die Daten der Replikate stellen nur eine Momentaufnahme der primären Daten zu einem bestimmten Zeitpunkt dar.