Es gibt aktuell einen Bug im NFNIC Treiber der Cisco UCS Plattform, der in Kombination mit Pure Storage zu Datenkorruption führen kann. Dadurch könnten VM’s oder unter Umständen sogar der ganze VMFS Datastore irreparabel zerstört werden. Nachfolgend ein Workaround wie dies zum aktuellen Zeitpunkt umgangen werden kann.
Problemstellung:
Das Phänomen tritt vorwiegend dann auf, wenn im SAN OOO (out of order) FC Frames versendet oder FC Frames «gedropped» werden. Dieses Verhalten entsteht normalerweise nur bei defekter Hardware oder bei allfälligem Neustart der SAN Komponenten. Auch bei aus- und einstecken von SAN Verbindungen kann der Fehler auftreten. Das Pure Flash Array versendet daraufhin einen FC_ABORT Command, der vom NFNIC Treiber falsch interpretiert wird und somit zu einem inkonsistenten Zustand führt. Diese beiden FC Frames treten im Normalfall in einem gesunden SAN nicht einfach so auf und somit sollte auch der Bug nicht einfach so eintreten. Trotzdem ist Vorsicht geboten, da es zu Datenkorruption und somit zu Datenverlust führen kann.
Weitere Informationen dazu finden Sie hier: https://kb.vmware.com/s/article/83073
Bin ich betroffen?
Betroffen davon sind sämtliche ESXi 6.X Versionen, welche den NFNIC Treiber einsetzen. Die Version des NFNIC ist dabei irrelevant.
Zusätzlich muss eine der nachfolgenden Purity Versionen eingesetzt werden:
Major Version | ESXi 6.X (6.0.0 bis 6.7.0) | Bug behoben ab Purity: |
NFNIC Treiber | jede Version | |
Purity | 5.3.6 bis 5.3.14 | 5.3.15 |
6.0.0 bis 6.0.5 | 6.0.6 | |
6.1.0 bis 6.1.2 | 6.1.3 |
Lösung:
Cisco arbeitet aktuell an einem neuen NFNIC Treiber, der diesen Bug beheben soll. Im Moment ist die einzige Option um den Bug zu beheben, beziehungsweise zu umgehen, die Purity Version auf die neuste Version des aktuellen Release-Channel aktualisieren zu lassen. Wir empfehlen somit, sämtliche Flash Arrays auf die neuste Version aktualisieren zu lassen. Bitte beachten Sie dabei aber bestehende Kompatibilitäts-Matrizen.
Die uniQconsulting ag unterstützt sie bei diesen Vorhaben jederzeit sehr gerne.
Vermerk:
Achtung!: Aktuell ist nur bekannt, dass dieses Phänomen in Zusammenhang mit den Flash Array's von Pure Storage auftritt. Da es sich um normale SCSI Commands handelt, könnten theoretisch weitere Storage Hersteller vom Bug betroffen sein. In unserem Blog informieren wir Sie laufend, sollten, so uns bekannt, weitere Hersteller davon betroffen sein.
Anfrage
Jetzt anmelden