Tunga molntjänsten kraschade
När Microsoft Azure helt nyligen låg nere i hela elva timmar började många fråga sig hur farligt det är att vara helt beroende av en molntjänst. Tunga tjänster som Xbox Live, MSN och Visual Studio Online blev oåtkomliga under en tid – för att inte tala om alla företag världen över som påverkades av kraschen.
Förutom att Azure gick ner så visade statussidan för tjänsten att den inte alls låg nere. Istället rapporterades att den både var uppe och utan störningar, något som givetvis blev helt missvisande för de som ville kolla vad som var på gång. Dubbel otur för Microsoft, som dock lyckades lösa problemen och få igång tjänsten till synes utan dataförlust för någon kund.
Uppdatering var felet
Anledningen till kraschen var en prestandauppdatering som genomgått rigorösa tester innan den implementerades i systemet. Dessvärre började de initiala problemen inte visa sig förrän uppdateringen rullats ut på bredare front och när dessa dök upp gick det hela inte att stoppa.
Vad som hände, i mycket generella drag, var att en front för bakomliggande tjänster på Azure gick in i en ändlös loop och slutade därför ta emot trafik. Därmed slutade alla kopplade tjänster att fungera för användarna och systemet kraschade.
Jag skulle inte vilja vara bland teknikerna som fick i uppdrag att lösa problemen med Azure. Det måste ligga en enorm press på dem att få jobbet gjort snabbt, vilket inte är konstigt med tanke på hur många som drabbas av fel likt det senaste.