Blackbox für Server-Abstürze: Der SSAS FlightRecorder

Seit dem SQL-Ser­ver 2005 gibt es für die Ana­ly­sis­Ser­vices eine groß­ar­tige Mög­lich­keit, um die inter­nen Abläufe und Pro­zesse wäh­rend des lau­fen­den Betriebs auf­zu­zeich­nen und spä­ter (z.B. nach einem Ser­ver­ab­sturz) zu ana­ly­sie­ren. Vor kur­zem hatte ich einen sol­chen Fall bei einem Kun­den: Der Ser­ver hat im lau­fen­den Betrieb plötz­lich nicht mehr reagiert. Natür­lich zu einer abso­lut unpas­sen­den Zeit. Bei dem Kun­den wur­den welt­weit Zah­len für die Pro­duk­ti­ons­pla­nung ein­ge­sam­melt und den Anwen­dern stan­den ins­ge­samt nur 48 Stun­den für die Daten­ein­gabe zur Ver­fü­gung. Der Ser­ver­still­stand ereig­nete sich nachts um kurz nach 1:00 Uhr MEZ – Daten­ein­gabe-Zeit in Asien. Natür­lich haben die Kol­le­gen aus Asien sofort eine Mail an den Admi­nis­tra­tor in Deutsch­land geschickt. Die ent­spre­chen­den Gegen­maß­nah­men wur­den aber erst ein­ge­lei­tet, als der Admi­nis­tra­tor gegen 7:30 Uhr sein Büro betre­ten und seine Mails gecheckt hatte. Der SSAS-Dienst wurde durch­ge­star­tet und alles lief wie­der ein­wand­frei.
Sechs geschla­gene Stun­den Sys­tem­still­stand bei einem Zeit­fens­ter von nur 48 Stun­den. Natür­lich kam die Frage auf, wie es dazu kom­men konnte und was in Zukunft getan wer­den kann, dass ein sol­ches Pro­blem nicht wie­der auf­tritt.
Zur Beant­wor­tung die­ser Fra­gen konnte das mit dem SSAS-Fligh­tRe­cor­der auf­ge­zeich­nete Trace-File einen ent­schei­den­den Bei­trag leis­ten! Aber zuerst ein paar Infor­ma­tio­nen zur Kon­fi­gu­ra­tion des Fligh­tRe­cor­der. wei­ter­le­sen…