Hur ML kan lösa mysterier för applikationsfel för ingenjörs- och supportteam

Hur ML kan lösa mysterier för applikationsfel för ingenjörs- och supportteam


Programvara gĂ„r ibland sönder – oavsett om det Ă€r i molnet, i en hĂ„rdvaruenhet eller i infrastruktur som nĂ€tverk och sĂ€kerhet. Det Ă€r ett oundvikligt faktum, frĂ€mst pĂ„ grund av frekventa koduppdateringar, kombinerat med komplexitet och otaliga anvĂ€ndningsvariabler. Ett problem med en applikation blir kostsamt för företag och kan till och med hota förlust av kunder, uppsagda kundvagnar eller skadat rykte.

Det sex timmar lÄnga Facebook-avbrottet i oktober 2021 resulterade i förluster pÄ 164 000 USD per minut och minskade företagets börsvÀrde med cirka 40 miljarder USD. AWS-avbrottet i december 2021 orsakade förödelse över de amerikanska bankerna, tjÀnsteföretagen och andra ÄterförsÀljare lider avsevÀrda förluster nÀr mobilappar eller webbapplikationer misslyckas. Avbrott och problem Àr extremt dyra, sÄ att ÄtgÀrda dem snabbt Àr av största vikt. Trycket Àr pÄ och klockan tickar. TyvÀrr Àr det sÀllan okomplicerat att hitta grundorsaken till dessa misslyckanden och krÀver ofta avsevÀrt detektivarbete.

I fallet med höstens Facebook-avbrott twittrade Downdetector att det var “det största avbrottet vi nĂ„gonsin sett pĂ„ Downdetector med över 10,6 miljoner problemrapporter frĂ„n hela vĂ€rlden.” Avbrottet identifierades slutligen som ett konfigurationsĂ€ndringsproblem. Enligt Uptime Institute 2020 avbrottsanalysrapporten blir avbrotten mer allvarliga och kostsamma. Samtidigt blir det mer komplext att Ă„tgĂ€rda dem nĂ€r funktioner vĂ€xer och beroenden av saker som mikrotjĂ€nster för mjukvara och molninfrastruktur ökar.

För att hitta grundorsaken, i en idealisk vÀrld, skulle ingenjörer och supportteam ha kontinuerliga strömmar av loggar, obegrÀnsad tid att analysera dem och en förstÄelse för problemet de Àr pÄ vÀg att felsöka, men sÄ Àr sÀllan fallet. Ofta fÄr de en bunt loggfiler i efterhand, utan nÄgot annat sammanhang eller förstÄelse för problemet. Sedan blir de tillsagda att sÀtta sina detektivkunskaper i arbete. Eftersom dessa filer ofta bara Àr en ögonblicksbild frÄn en period pÄ nÄgra timmar pÄ dagen för hÀndelsen, kan det verka som en skrÀmmande uppgift, ett olösligt mysterium att skapa en förstÄelse för vad som gick fel.

Tack vare nÄgra mycket smarta maskininlÀrningstekniker (ML) kan till och med en statisk bunt loggar snabbt ge svaren. ML-driven rotorsaksanalys kan identifiera mönster och samband som kanske inte Àr uppenbara för en supportingenjörs blotta ögon och avslöja orsaken till en incident mycket snabbare Àn genom manuell analys. Detta ökar inte bara upplösningshastigheten, utan det förbÀttrar ocksÄ teamets produktivitet och effektivitet.

I de flesta fall kompliceras utmaningen att hitta grundorsaken av den stora storleken och antalet stockar, deras röriga och ostrukturerade karaktÀr och bristen pÄ klarhet över vad man försöker hitta. Alla dessa faktorer gynnar ML, inte för att uppgiften Àr omöjlig för utbildad personal, utan för att ML arbetar snabbare Àn mÀnskliga ögon och skalar bortom grÀnserna för tillgÀngliga mÀnskliga resurser.

NÀr du felsöker genom att analysera loggar börjar skickliga ingenjörer vanligtvis med att titta i loggarna efter sÀllsynta och ovÀntade logghÀndelser och korrelera dem med fel. Ju större volym av loggar och data, desto svÄrare Àr det för mÀnniskor och desto större vÀrdeförslag för att anvÀnda ML. SvÄrigheten med uppgiften vÀxer nÀr man gÄr frÄn att granska omfattande data till att sedan hitta anomalier och göra korrelationer som ger meningsfull insikt. Med ML kan varje steg utföras autonomt och kan enkelt skalas till nÀstan vilken datavolym som helst.

ML Àr ocksÄ bÀttre lÀmpad för att faststÀlla den verkliga grundorsaken till ett problem. I en kapplöpning mot tiden och med teamresursbegrÀnsningar kommer ingenjörer och supportpersonal ofta att hitta en snabb lösning eller lösning snarare Àn att identifiera och ta itu med dess verkliga grundorsak. Detta innebÀr ofta att samma problem kommer att intrÀffa igen och kan pÄverka mÄnga andra kunder ocksÄ. Men nÀr ML anvÀnds för att avslöja grundorsaken kan ingenjörer anvÀnda sin begrÀnsade tid för att arbeta direkt med att ÄtgÀrda kÀllan till problemet och förhindra att det fÄr en fortlöpande inverkan.

Naturligtvis Ă€r ML inte ett universalmedel för hela applikationsstödet. Utbildade yrkesmĂ€n behöver fortfarande granska ML-fynden och genomföra den korrekta Ă„tgĂ€rden. Även om mycket av den övergripande processen nu kan automatiseras, lĂ€mnar den teammedlemmarna att anvĂ€nda sin expertis i den viktigaste uppgiften – den “sista milen”. Resultatet av att anvĂ€nda ML pĂ„skyndar hela processen, ökar teamets effektivitet och ger proffs mer tid att arbeta med viktiga uppgifter.

Med komplexiteten i applikationer och miljöer som stÀndigt ökar och kraven pÄ supportorganisationer ökar, gÄr introduktionen av ML för loggar till applikationssupportprocessen snabbt frÄn en lyx till en nödvÀndighet.

DataDecisionMakers

VĂ€lkommen till VentureBeat-communityt!

DataDecisionMakers Àr dÀr experter, inklusive tekniska personer som arbetar med data, kan dela datarelaterade insikter och innovation.

Om du vill lĂ€sa om banbrytande idĂ©er och aktuell information, bĂ€sta praxis och framtiden för data- och datateknik, gĂ„ med oss ​​pĂ„ DataDecisionMakers.

Du kan till och med övervÀga att bidra med en egen artikel!

LÀs mer frÄn DataDecisionMakers