Projekt numero uno – Das Finale rückt näher!

Apr,2020

So langsam neigt sich das erste Projekt dem Ende.
Letzte Woche haben wir diverse Systeme wie den Backupserver in das neue Rack verbaut und die Komponenten möglichst auf 10GE angehoben.

Performance-Tests
Am Freitag habe ich dann auf das neue Storage paar Performance- und Belastungstests gemacht.
Nochmal zum Hintergrund – die meisten Daten des Kunden lagen auf einer All-flash 3PAR 7200c. Für den Performancetest habe ich nun diverse IOs auf die neue All-flash MSA 2050 prasseln lassen – mit der Hilfe eines kleinen Tools namens IOmeter.

Bei einem 100% read-Test haben wir auf der MSA ~180K IOPS erreicht.
Bei dem 100% write-Test kamen wir noch auf 77k IOPS.
Auf den Grafiken erkennt man auf der linken Seite die Performancewerte, die die MSA ausgibt und rechts die Werte von dem IOmeter.

Trau keiner Messung, die du selbst nicht gefälscht hast

Ja, stimme ich zu. Wir haben von der alten Bestandsumgebung die Performancewerte über 7 Tage gemessen und konnten so feststellen, was in der Umgebung passiert.
Ich habe den gemessenen Workload mit dem IOmeter simuliert.
Es kamen bei 100% random Zugriff, ca 33% write und 67 % read (“mixed use”) dann entspannte 44k IOPS raus, die das System locker abgefedert hat.

Wenn man ein zahlengeiler Storage-Muffti ist, interessieren einen solche Werte. Dass die Werte noch variieren + skalieren + eskalieren können, sollte klar sein. Dass hier die Controller noch cachen ist auch klar – aber auch gut.
Was ich erstaunlich finde sind die “Average I/O Respone Time” die bei unter 1ms liegt. Super Wert, wenn wir von den 100 % random IOs ausgehen.
Aus meiner technischen Sicht ist so ein “Gegenprüfen” immer sinnvoll und notwendig. Erstmal weil man eine künstliche Hochbelastung erzeugt und man gegenchecken kann, was das System am Ende kann.

Umstellung auf das neue Storage

Also haben wir am Wochenende die komplette Umstellung auf das neue Storage gemacht. Im Laufe der letzten Woche hatte “die IT-Leitung” meines Vertrauens bereits sukzessive VMs auf die neuen ESXi-Hosts mit angebundenem MSA-Storage verschoben. In Summe hat das sehr gut funktioniert.
Am Freitag habe ich einen zusätzlichen “one time Backupjob” von den wichtigsten Systemen durchlaufen lassen. Anschließend wurden die großen Brocken an VMs ab Samstagmorgen verschoben. Bottleneck war – genau, das Netzwerk 🙂

Sonntag war dann ein vor Ort Einsatz abgesprochen. Da ich geschäftsführender Gesellschafter meines kleinen 1-Mann-Unternehmens bin, habe ich mir erlaubt, im Dresscode “Jogginghose und Football T-Shirt” zu erscheinen.
Der Vorteil eines IT-Freiträgers…. ich meine IT-Freidenkers. #FreeDressCode

Beschwerden können an meinen direkten Vorgesetzten gesendet werden … 😉 Es wurden Sonntag viele Themen sehr effektiv abgearbeitet.
Unter anderem

  • sämtliche Daten der 3PAR verschoben und aus dem alten SAN nehmen
  • freiräumen der alten ESXi-Hosts
  • Die Komponenten physisch vom SAN lösen und auflösen der alten SAN-Fabrics
  • ausschalten der nicht benötigten ESXi-Hosts, eines c7000 Enclosure und eines EonStore
  • Umbau der 3Par + NetApp und physischer SQL Server in das neue Rack
  • Aufrüsten des SQL-Servers mit 10GE und 8Gbps FC-Karten und Teamen der Komponenten
  • Firmware und Treiberupgrade bei diversen Systemen
  • Neu zonen der 3Par (die werden wir nach reset + update + re-design weiter benutzen)
  • Beschriften aller Komponenten
  • Zugriffs – und Ausfalltests (also das abschließen von FC-/Netzwerk- & Stromkabeln)
  • Upgrade der VMware Tools + VM Version
  • Umstellung auf vmxnet3 Adapter innerhalb der VMs (damit die Kommunikation über 10GE bis in die VMs funktioniert)
  • usw usw usw …

Ich würde meinen, wir haben so einiges geschafft. Ich war am Sonntag gegen halb 10 Uhr draußen und doch beruhigt, dass bis auf eine 15k HDD bei dem SQL-Server nichts über den Jordan gegangen ist. Dafür gab es zum Glück eine Cold-Spare Disk.

Heute Morgen lief soweit auch alles weitestgehend “ruhig”. Bis auf ein VDI Pool der neu deployed werden musste, hatte es keine größeren oder kleineren Probleme gegeben, die mit dieser Umstellung zu tun hatten.
Nun steht in erster Linie Ruhe bewahren an. Alle sind aufgeregt, aufgebraust und hoch interessiert, was es da gibt, was es macht usw usw.

Ich habe mich dann kurz dem Veeam und VeeamOne angenommen und dort nach und nach paar Ausnahmen definiert. Wichtig ist sowas natürlich immer mit zu pflegen.

Im nächsten Schritt werde ich nun alles wichtige dokumentieren.
Dann halte ich es für sinnvoll, dass eine kurze Einweisung an die Admins vor Ort stattfindet (zugegeben, die haben alle sehr gut mitgemacht).
Und wenn dann alles zur Ruhe kommt, kann man die nächsten Themen angehen.

Ich bin gespannt wie es weiter geht …