Disaster Recovery
Geführter Failover zwischen PowerScale-Clustern. Minimale Ausfallzeit, maximale Kontrolle — Schritt für Schritt begleitet.
Vier Failover-Typen — für jede Anforderung der richtige
SyncIQ
Verlagert die Datenhoheit einzelner SyncIQ-Policies vom Quell- auf den Zielcluster. Clusterize pausiert Replikations-Pläne, startet einen letzten Sync, hebt den Schreibschutz auf dem Ziel auf und bereitet den Rückweg vor — ideal für datenzentrische Umschaltungen und einmalige Migrationen.
Access Zone
Der volle Produktions-Failover: Daten, Netzwerk und Dienste einer Access Zone wechseln gemeinsam. Clusterize konfiguriert Netzwerk-Interfaces um, tauscht SmartConnect-Zonen und Service Principal Names, überträgt SMB-/NFS-Share-Konfiguration und Quotas — und schließt offene SMB-Verbindungen mit SMB-Integrity sauber ab.
Pool-basiert
Granularer IP-Pool-Failover für gezielte Netzwerkumschaltung zwischen Clustern. Statt eine komplette Access Zone zu wechseln, werden einzelne IP-Pools überführt — hilfreich, wenn nur ein Teil der Workloads umziehen soll.
DFS-Integration
Microsoft-DFS-Integration für transparenten SMB-Client-Failover ohne Änderungen an Client-Konfigurationen. Clients folgen dem DFS-Referral auf den neuen Zielpfad — ohne neu verbundene Laufwerke, ohne Support-Ticket.
Nur ein paar Schritte, dann sind Sie drüben
Der Wizard führt Sie direkt zum Cutover. Sie sagen clusterize, was wechseln soll — den Rest orchestriert es. Eine durchgehende Preflight-Leiste am Kopf des Dialogs gleicht Ihre Auswahl in Echtzeit gegen die tatsächliche Situation auf den Clustern ab.
Modus wählen
Maintenance oder Disaster.
Typ wählen
SyncIQ, Access Zone, Pool-basiert oder DFS — je nach Situation.
Richtung wählen
Von welchem Cluster auf welchen Cluster.
Objekte auswählen
Konkret die Access Zones oder SyncIQ-Policies, die umgeschaltet werden sollen.
Wie funktioniert der Failover?
Ein Failover ist kein Einzelschritt, sondern eine geordnete Reihe von Teiloperationen: Schedules pausieren, letzter Sync, Schreibschutz auf dem Ziel aufheben, Netzwerk umkonfigurieren, SmartConnect-Zonen tauschen, Konfiguration übertragen, Services hochfahren. Clusterize orchestriert diese Reihe — Sie geben den Startschuss.
Der Fortschritt ist in Echtzeit sichtbar, jeder Teilschritt lässt sich nachlesen. Scheitert ein Failover, zeigt clusterize exakt, an welcher Stelle und warum — statt Sie mit einer Fehlermeldung allein zu lassen.
Nicht-invasiv und sicher
Wie alle clusterize-Module arbeitet auch Disaster Recovery ausschließlich über die Dell-OneFS-REST-API. Keine Agenten, keine Installation auf dem Speichersystem — ein Failover ist am Ende eine Sequenz gut durchdachter API-Aufrufe.
Arbeiten über DFS-Namespaces oder SmartConnect bleiben transparent: clusterize tauscht Zonen-Namen und DNS, nicht Client-Konfigurationen. Nutzer merken von der Umschaltung im besten Fall nichts.
Die richtigen Stellschrauben
Nicht jeder Failover sieht gleich aus. Die relevanten Optionen liegen zusammen in einem einzigen Wizard-Schritt — mit sicheren Vorgaben, die sich an Ihren Anwendungsfall anpassen lassen.
Im Disaster-Modus werden alle Optionen, die den Quellcluster voraussetzen, automatisch deaktiviert — Sie müssen nicht daran denken.
SMB Integrity Failover
Offene SMB-Verbindungen werden vor der Umschaltung sauber beendet.
Protocol Config Transfer
SMB- und NFS-Share-Konfiguration ziehen mit um.
Quota Transfer
Quotas werden vor dem Cutover auf das Ziel übertragen.
Dutzende Prüfungen, eine klare Ampel
Vom SyncIQ-Status über Access-Zone-Mappings bis zu Service Principal Names und Split-Brain-Erkennung: Die Preflight-Oberfläche bündelt alle Prüfungen, die für eine saubere Umschaltung zählen. Jeder Fund kommt mit Beschreibung, Severity und — wo möglich — einem konkreten Lösungsvorschlag.
Probieren Sie's aus: Schieben Sie den Schwellenwert nach rechts — alles unterhalb wird ausgeblendet. So sehen Sie entweder alles oder nur das, was Sie tatsächlich blockiert.
Target Cluster Upgrade State Passed
Verifies that the target cluster is not in an upgrade state.
Service Principal Name Validation Warning
Verifies both clusters can manipulate SPNs in each other's AD computer accounts.
-
prod-dus → prod-hh
SPN validation failed for host/prod-hh-01 — missing write permission on the target cluster's AD computer account.
Resolution: Add the source cluster's computer account to the target's „SPN-Writer" AD group and re-run.
Service Principal Name Completeness Error
Verifies all cluster member nodes have their SPNs registered.
-
prod-hh-03
Node is missing host/ and cifs/ SPN entries. SMB authentication will fail after failover.
Resolution: Run isi auth ads spn create on prod-hh-03 for each missing service.
+ 185 weitere Prüfungen nicht dargestellt
Keine Prüfungen in dieser Gruppe erfüllen den aktuellen Filter.
Access Zone is not System Zone Passed
Verifies the failover target is not the System Access Zone.
Access Zone Path Collision Info
Detects overlapping base paths between access zones.
-
Zone „research"
Base path /ifs/research overlaps with /ifs/research/shared in zone „research-shared". Not failure-causing, but worth confirming.
Access Zone Pools are Mapped Warning
Checks that all access zone pools are mapped between clusters.
-
Pool subnet0:pool1
Pool exists on source but no mapping is defined on target.
Resolution: Map pool1 to the corresponding access zone via Settings → Access Zone Mappings.
Access Zone Cross-Sync Critical
Detects if both clusters have active SyncIQ policies writing into the same access zone.
-
Zone „home-dirs"
Active SyncIQ policies run from both clusters into the same access zone. A failover would silently overwrite data in one direction.
Resolution: Disable one of the conflicting policies on the losing side before proceeding.
+ 227 weitere Prüfungen nicht dargestellt
Keine Prüfungen in dieser Gruppe erfüllen den aktuellen Filter.
SyncIQ Policy Enabled Passed
Verifies the SyncIQ policy is enabled.
SyncIQ Mirror Policy Exists Passed
Verifies a mirror policy exists on the target cluster.
SyncIQ Policy Last Run Info
Verifies the SyncIQ policy has run recently.
-
home-dirs-hourly
Last successful run 27 hours ago. Recommended cadence is under 24 hours.
SyncIQ Target FOFB State Warning
Verifies the target policy failover/failback state is ready for operations.
-
research-nightly
Target is in writable_ready state; expected enabled.
SyncIQ Last Job State Error
Verifies the last SyncIQ job completed successfully.
-
home-dirs-weekly
Last job failed: „target unreachable: connection refused" at 03:12 UTC.
Resolution: Check network connectivity between source and target clusters on TCP/2098.
+ 211 weitere Prüfungen nicht dargestellt
Keine Prüfungen in dieser Gruppe erfüllen den aktuellen Filter.
Ein Klick zurück — heute, morgen oder in sechs Monaten
Clusterize merkt sich jeden durchgeführten Failover dauerhaft: wann er lief, in welche Richtung, welche Objekte betroffen waren, mit welchen Optionen. Ein Failback ist aus Ihrer Sicht deshalb kein neuer Vorgang, sondern ein Rückwärts-Klick auf einen konkreten früheren Failover — egal ob das morgen passiert, in einer Woche oder erst in einem halben Jahr.
Kein Durchklicken durch Modus, Typ, Richtung, Objekte. Sie suchen in der Failover-Historie den Eintrag, drücken „Failback", bestätigen kurz — und sind wieder dort, wo Sie vor der Umschaltung waren.
Disaster Recovery im Einsatz erleben
Von der Vorabprüfung bis zum abgeschlossenen Failover — wir zeigen es Ihnen Schritt für Schritt in einer Live-Demo.