Atunci când ai un business mai serios, te gândeşti în mod normal şi la o soluţie de continuitate a business-ului în caz de dezastre. Ei bine, o să dau un exemplu foarte simplu în care o astfel de soluţie (destul de costisitoare) a fost anihilată şi (ce e mai trist) a trecut ceva vreme până a fost reactivată.
Soluţia de DRP este foarte simplă: se bazează pe Oracle Active Stanby Database. Foarte pe scurt, redolog-urile sunt transmise de pe baza de date primară pe o bază de date secundară unde sunt aplicate şi şterse. Din motive tehnice, aplicarea log-urilor pe baza secundară şi ştergerea lor nu a mai decurs corespunzător, acest lucru generând o alertă pentru spaţiu pe disc. Nimic deosebit până acum. Doar că tratarea incidentului a fost defectuoasă. Deşi exista un grad ridicat de urgenţă pentru rezolvarea acestui incident, neexistând nici un impact vizibil asupra mediului de producţie, rezoluţia a fost foarte mult întârziată. Ce se întâmpla dacă în acest interval trebuia activată solutia de BC ? O întrebare fără răspuns.
Ce trebuie învăţat de aici:
- definiţia unui incident nu trebuie uitată: (Service Operation) întreruperea neplanificată a unui serviciu IT sau degradarea calităţii unui serviciu IT. Defectarea unui element de configurare care nu a afectat înca un serviciu reprezintă de asemenea un incident.
- prioritatea incidentului este determinată de urgenţă x impact
- revizuirea periodică a incidentelor (indiferent de prioritate) ajută la detectarea unor astfel de situaţii
- toţi participanţii în oferirea unui serviciu IT trebuie periodic educaţi, o solutie de BC este ultima scăpare în situaţii neplăcute.
Wednesday, November 11, 2009
Subscribe to:
Post Comments (Atom)
No comments:
Post a Comment