Disaster Recovery

Vier Failover-Typen — für jede Anforderung der richtige

SyncIQ

Verlagert die Datenhoheit einzelner SyncIQ-Policies vom Quell- auf den Zielcluster. Clusterize pausiert Replikations-Pläne, startet einen letzten Sync, hebt den Schreibschutz auf dem Ziel auf und bereitet den Rückweg vor — ideal für datenzentrische Umschaltungen und einmalige Migrationen.

Access Zone

Der volle Produktions-Failover: Daten, Netzwerk und Dienste einer Access Zone wechseln gemeinsam. Clusterize konfiguriert Netzwerk-Interfaces um, tauscht SmartConnect-Zonen und Service Principal Names, überträgt SMB-/NFS-Share-Konfiguration und Quotas — und schließt offene SMB-Verbindungen mit SMB-Integrity sauber ab.

Pool-basiert

Granularer IP-Pool-Failover für gezielte Netzwerkumschaltung zwischen Clustern. Statt eine komplette Access Zone zu wechseln, werden einzelne IP-Pools überführt — hilfreich, wenn nur ein Teil der Workloads umziehen soll.

DFS-Integration

Microsoft-DFS-Integration für transparenten SMB-Client-Failover ohne Änderungen an Client-Konfigurationen. Clients folgen dem DFS-Referral auf den neuen Zielpfad — ohne neu verbundene Laufwerke, ohne Support-Ticket.

Nur ein paar Schritte, dann sind Sie drüben

Der Wizard führt Sie direkt zum Cutover. Sie sagen clusterize, was wechseln soll — den Rest orchestriert es. Eine durchgehende Preflight-Leiste am Kopf des Dialogs gleicht Ihre Auswahl in Echtzeit gegen die tatsächliche Situation auf den Clustern ab.

1

Modus wählen

Maintenance oder Disaster.

2

Typ wählen

SyncIQ, Access Zone, Pool-basiert oder DFS — je nach Situation.

3

Richtung wählen

Von welchem Cluster auf welchen Cluster.

4

Objekte auswählen

Konkret die Access Zones oder SyncIQ-Policies, die umgeschaltet werden sollen.

Wie funktioniert der Failover?

Ein Failover ist kein Einzelschritt, sondern eine geordnete Reihe von Teiloperationen: Schedules pausieren, letzter Sync, Schreibschutz auf dem Ziel aufheben, Netzwerk umkonfigurieren, SmartConnect-Zonen tauschen, Konfiguration übertragen, Services hochfahren. Clusterize orchestriert diese Reihe — Sie geben den Startschuss.

Der Fortschritt ist in Echtzeit sichtbar, jeder Teilschritt lässt sich nachlesen. Scheitert ein Failover, zeigt clusterize exakt, an welcher Stelle und warum — statt Sie mit einer Fehlermeldung allein zu lassen.

Nicht-invasiv und sicher

Wie alle clusterize-Module arbeitet auch Disaster Recovery ausschließlich über die Dell-OneFS-REST-API. Keine Agenten, keine Installation auf dem Speichersystem — ein Failover ist am Ende eine Sequenz gut durchdachter API-Aufrufe.

Arbeiten über DFS-Namespaces oder SmartConnect bleiben transparent: clusterize tauscht Zonen-Namen und DNS, nicht Client-Konfigurationen. Nutzer merken von der Umschaltung im besten Fall nichts.

Die richtigen Stellschrauben

Nicht jeder Failover sieht gleich aus. Die relevanten Optionen liegen zusammen in einem einzigen Wizard-Schritt — mit sicheren Vorgaben, die sich an Ihren Anwendungsfall anpassen lassen.

Im Disaster-Modus werden alle Optionen, die den Quellcluster voraussetzen, automatisch deaktiviert — Sie müssen nicht daran denken.

SMB Integrity Failover

Offene SMB-Verbindungen werden vor der Umschaltung sauber beendet.

Protocol Config Transfer

SMB- und NFS-Share-Konfiguration ziehen mit um.

Quota Transfer

Quotas werden vor dem Cutover auf das Ziel übertragen.

Dutzende Prüfungen, eine klare Ampel

Vom SyncIQ-Status über Access-Zone-Mappings bis zu Service Principal Names und Split-Brain-Erkennung: Die Preflight-Oberfläche bündelt alle Prüfungen, die für eine saubere Umschaltung zählen. Jeder Fund kommt mit Beschreibung, Severity und — wo möglich — einem konkreten Lösungsvorschlag.

Probieren Sie's aus: Schieben Sie den Schwellenwert nach rechts — alles unterhalb wird ausgeblendet. So sehen Sie entweder alles oder nur das, was Sie tatsächlich blockiert.

Preflight Checks Last checked vor 2 Minuten

Total 635

Passed 542

Info 44

Warning 30

Error 18

Critical 1

Severity threshold Passed

Cluster 188

Target Cluster Upgrade State Passed

Verifies that the target cluster is not in an upgrade state.

Service Principal Name Validation Warning

Verifies both clusters can manipulate SPNs in each other's AD computer accounts.

prod-dus → prod-hh

SPN validation failed for host/prod-hh-01 — missing write permission on the target cluster's AD computer account.

Resolution: Add the source cluster's computer account to the target's „SPN-Writer" AD group and re-run.

Service Principal Name Completeness Error

Verifies all cluster member nodes have their SPNs registered.

prod-hh-03

Node is missing host/ and cifs/ SPN entries. SMB authentication will fail after failover.

Resolution: Run isi auth ads spn create on prod-hh-03 for each missing service.

+ 185 weitere Prüfungen nicht dargestellt

Access Zone 231

Access Zone is not System Zone Passed

Verifies the failover target is not the System Access Zone.

Access Zone Path Collision Info

Detects overlapping base paths between access zones.

Zone „research"

Base path /ifs/research overlaps with /ifs/research/shared in zone „research-shared". Not failure-causing, but worth confirming.

Access Zone Pools are Mapped Warning

Checks that all access zone pools are mapped between clusters.

Pool subnet0:pool1

Pool exists on source but no mapping is defined on target.

Resolution: Map pool1 to the corresponding access zone via Settings → Access Zone Mappings.

Access Zone Cross-Sync Critical

Detects if both clusters have active SyncIQ policies writing into the same access zone.

Zone „home-dirs"

Active SyncIQ policies run from both clusters into the same access zone. A failover would silently overwrite data in one direction.

Resolution: Disable one of the conflicting policies on the losing side before proceeding.

+ 227 weitere Prüfungen nicht dargestellt

SyncIQ Policy 216

SyncIQ Policy Enabled Passed

Verifies the SyncIQ policy is enabled.

SyncIQ Mirror Policy Exists Passed

Verifies a mirror policy exists on the target cluster.

SyncIQ Policy Last Run Info

Verifies the SyncIQ policy has run recently.

home-dirs-hourly

Last successful run 27 hours ago. Recommended cadence is under 24 hours.

SyncIQ Target FOFB State Warning

Verifies the target policy failover/failback state is ready for operations.

research-nightly

Target is in writable_ready state; expected enabled.

SyncIQ Last Job State Error

Verifies the last SyncIQ job completed successfully.

home-dirs-weekly

Last job failed: „target unreachable: connection refused" at 03:12 UTC.

Resolution: Check network connectivity between source and target clusters on TCP/2098.

+ 211 weitere Prüfungen nicht dargestellt

Ein Klick zurück — heute, morgen oder in sechs Monaten

Clusterize merkt sich jeden durchgeführten Failover dauerhaft: wann er lief, in welche Richtung, welche Objekte betroffen waren, mit welchen Optionen. Ein Failback ist aus Ihrer Sicht deshalb kein neuer Vorgang, sondern ein Rückwärts-Klick auf einen konkreten früheren Failover — egal ob das morgen passiert, in einer Woche oder erst in einem halben Jahr.

Kein Durchklicken durch Modus, Typ, Richtung, Objekte. Sie suchen in der Failover-Historie den Eintrag, drücken „Failback", bestätigen kurz — und sind wieder dort, wo Sie vor der Umschaltung waren.