VMware vSphere HA fail-over in action – aka reading the log files

In diesem Artikel heisst es: Zurück in die Vergangenheit / Zukunft..

Beim Stöbern nach neuen und interessanten Themen, über die man schreiben könnte, bin ich über eine Veröffentlichung aus dem Jahre 2012 gestolpert, welche bis heute immer noch sehr lesenswert (und trotz des schnelllebigen IT-Zeitalters immer noch aktuell) ist.

Auf der letztjährigen VMworld in Barcelona war ich ein paar Stunden mit Duncan Epping (Author der „VMware vSphere Clustering Technical Deepdive“ Bücher) zusammengesessen und habe über einige Advanced HA Settings und HA Verhalten „philosophiert“.

In der Diskussion ging es darum, dass man den HA Heartbeat mit einigen Advanced Settings so manipulieren kann, dass der HA Heartbeat mit über das ISCSI/NFS-Storagenetz läuft. Verliert ein Host nun diese Verbindung, fallen gleichzeitig der Network Heartbeat, sowie der Storage Heartbeat aus… Obwohl der Server vllt. über einen anderen VMkernel noch im vCenter erreichbar ist und physikalisch noch 100% läuft, wird der Host nicht als „isolated“ oder „partitioned“ sondern direkt als „dead“ deklariert (kein ping mehr über Heartbeat Netzwerk, keine Verbindung mehr zu den Isolationsadressen, kein Storage Heartbeat mehr = „dead“).

Der Host läuft also noch, wird aber vom HA Cluster als „dead“ deklariert und startet die VMs auf den verbleibenden Hosts neu. Klingt komisch, is‘ aber so… ;)

Nachdem Duncan und ich dann einige Logfiles ausgetauscht und ge“parse“d haben, fragte er mich, ob er diese Logfiles (fdm.log) und deren Analyse für einen seiner Artikel verwenden dürfte. Das Ergebnis findet ihr auf seinem Yellow Bricks Blog im Artikel vSphere HA fail-over in action – aka reading the log files.

Wer das einmal „live“ erleben und ausführlich erklärt haben möchte, darf mich gerne in meinem Kurs VI113 – vSphere Advanced Features bei der Firma qSkills in Nürnberg besuchen ;)

– I wish I could be a Virtual Machine –

Benjamin Ulsamer

Advertisements