Hur man skapar datahanteringspolicyer för ostrukturerad data

nRoad lanserar ny plattform för företag att utnyttja ostrukturerad data


Om data Ă€r livsnerven för din organisation – som dikterar framgĂ„ngen för kundrelationer, produktlanseringar, korsförsĂ€ljning och merförsĂ€ljning och anstĂ€lldas produktivitet – mĂ„ste du hantera det strategiskt. Den strategin bör innehĂ„lla ett program för datahanteringspolicyer. Detta sĂ€kerstĂ€ller att data alltid lagras i lĂ€mplig miljö i enlighet med dess anvĂ€ndning, Ă„lder, vĂ€rde och affĂ€rsprioritet. Och de parametrarna förĂ€ndras hela tiden.

En elbilstillverkare vill till exempel förstÄ hur dess fordon presterar under olika klimatförhÄllanden. DÀrför kanske de vill skapa en datahanteringspolicy för att kontinuerligt dra spÄrfiler frÄn bilar med jÀmna mellanrum till datasjöar och analysera dem. NÀr studien har slutförts kommer den policyn att upphöra och den flyttade informationen kan raderas eller flyttas till djup arkivlagring. Ett sjukhus kan ha en policy att behÄlla medicinska bilder för patientens liv och policyn kan diktera var och nÀr dessa bilder flyttas till kylförvaring. Vissa organisationer Àr skyldiga att radera filer frÄn före detta anstÀllda omedelbart eller efter en viss tid. Att göra detta manuellt Àr inte lÀngre ett gÄngbart alternativ med tanke pÄ omfattningen av data som lagras i företag idag.

Med data som vĂ€xer i en aldrig tidigare skĂ„dad hastighet, som utgör 30 % eller mer av den totala IT-budgeten pĂ„ dess lagring, Ă€r det nu dags att gĂ„ ner pĂ„ idĂ©n om automatisering av datahanteringspolicy. Lejonparten av all data Ă€r ostrukturerad – filer av alla typer inklusive bilder, loggfiler, spĂ„rningsfiler, utdatafiler, video och ljud, och som sprider sig som en löpeld. Datahanteringspolicyer mĂ„ste ta itu med effektiv förflyttning och hantering av ostrukturerad data.

Fördelarna med att anta ett systematiskt sÀtt att skapa, utföra och hantera policyer för data inkluderar:

Automatiserade policyer anpassar datastrategin till affÀrsmÄlen; Förenklar datahantering genom att minska manuella anstrÀngningar och ad hoc-beslutsfattande; Ger möjlighet att maximera kostnadsbesparingar genom att kontinuerligt flytta kalla datanivÄer till billigare lagring; SÀkerstÀller efterlevnad av branschregler; LÀgger till skydd mot ransomware genom att kopiera data frÄn primÀr lagring till objektlÄs lagring dÀr den inte kan Àventyras; Matar automatiskt datapipelines till datasjöar och verktyg för analys- och AI-program.

Uppfattningen om datahanteringspolicyer Àr inte ny, men historiskt sett Àgde denna aktivitet rum inom lagringsleverantörsteknologi. Ett lagringsleverantörscentrerat tillvÀgagÄngssÀtt var vÀl och bra innan data nÄdde dagens petabyte och vÀxande nivÄer och innan organisationer anvÀnde flera lagringsleverantörer och moln för att hantera sin data. Men nu skapar det lagringscentrerade tillvÀgagÄngssÀttet för policyhantering leverantörslÄsning och silos, vilket gör det besvÀrligt att kostnadseffektivt hantera data och flytta den pÄ ett ÀndamÄlsenligt sÀtt till olika lagringsteknologier och tjÀnster efter behov för att stödja anvÀndare, big data analytics initiativ och kostnad -sparmandat. IT-ledare vet att i den digitala tidsÄldern behöver data mer Àn skydd. Den behöver fullstÀndig livscykelhantering och det Àr dÀr modern datahanteringspolicy kommer in i bilden.

ÖvervĂ€ganden för att hantera ostrukturerade datahanteringspolicyer

Åtkomst var som helst. Distribuerade arbetsstyrkor krĂ€ver nu omedelbar tillgĂ„ng till data – oavsett var den lagras – med en transparent anvĂ€ndarupplevelse. Dataproffs bör prioritera dessa behov nĂ€r de skapar policyer för att spara pengar, skydda data och möjliggöra Ă„tkomstkontroller.

Automatisera sĂ„ mycket du kan. Ett deklarativt förhĂ„llningssĂ€tt Ă€r mĂ„let. Även om det finns mĂ„nga tillgĂ€ngliga alternativ nu med hjĂ€lp av oberoende datahanteringsprogram för att hantera policyer över lagring, anvĂ€nder mĂ„nga organisationer fortfarande IT-chefer och kalkylblad för att skapa och spĂ„ra policyer. Den vĂ€rsta delen av denna skrĂ€ddarsydda manuella anstrĂ€ngning Ă€r att söka efter filer som innehĂ„ller vissa attribut och sedan flytta eller ta bort dem. Dessa anstrĂ€ngningar Ă€r ineffektiva, ofullstĂ€ndiga och hindrar mĂ„len med att ha politik; det Ă€r smĂ€rtsamt att underhĂ„lla dem, och IT-proffs har för mĂ„nga konkurrerande prioriteringar. Dessutom begrĂ€nsar detta tillvĂ€gagĂ„ngssĂ€tt möjligheten att anvĂ€nda policyer för att kontinuerligt kurera och flytta data till datasjöar för strategiska AI- och ML-projekt. Leta istĂ€llet efter en lösning med ett intuitivt grĂ€nssnitt för att bygga och köra enligt ett schema och som körs i bakgrunden utan mĂ€nsklig inblandning.

MÀt resultat och förfina. All datahanteringspolicy bör kopplas till specifika mÄl, sÄsom kostnadsbesparingar pÄ lagring och sÀkerhetskopiering. Den bör mÀta dessa utfall och lÄta dig veta deras status sÄ att om dessa mÄl inte uppnÄs kan du Àndra planerna i enlighet med detta. Detta liknar en rökdetektor som alltid kontrollerar sitt eget batteri och sedan varnar dig nÀr det Àr dags att byta ut det. Datahanteringsverktyg bör göra det tunga arbetet Ät dig och lÄta dig veta nÀr nÄgot inte fungerar eller det finns ett problem att ÄtgÀrda.

Om du till exempel har en datahanteringsplan som delar data efter att den nÄr ett Ärs Älder till objektlagring i molnet, förvÀntar du dig en viss procentandel av besparingarna. Men om dessa kalla data ofta dras tillbaka till lokala applikationer och lagring, kommer du att möta höga uttrÀdesavgifter som kommer att motverka dessa besparingar. Vid det tillfÀllet skulle du vilja övervÀga en annan nivÄmodell, eller Ànnu bÀttre, en datahanteringslösning som kÀnner igen aktiviteten och trenden för den senaste tidens tillgÄng till kall data och tillÀmpar den deklarativa ÄtgÀrden för att placera den pÄ rÀtt sÀtt.

Anpassa personalens roller. Datahanteringspolicyer bör hanteras av ett team inom organisationen som identifierar hur policyer skapas, nÄs och anvÀnds. Teamet ansvarar ocksÄ för att hantera, tillÀmpa och förfina policyer och kommunicera dem till anstÀllda med behov av att veta. Stora företag bör övervÀga att skapa ett policyteam för datahantering inklusive toppchefer som bidrar till diskussioner om datastyrning, skydd och intÀktsgenerering. Det hÀr teamet kommer att samordna sig med affÀrsenheterna för att sÀkerstÀlla att bevarande- och skyddsövervÀganden Àr konsekventa.

Metadatahantering för ostrukturerad data: Ett annat övervÀgande Àr att förenkla sökningar över all filmetadata frÄn ett enhetligt filindex. Tekniken bör ocksÄ möjliggöra ÄtgÀrder för att kopiera, flytta, arkivera, gruppera och rapportera om ostrukturerade datafiler.

Sammanfattningsvis Àgs inte företagsdata av nÄgon individ eller affÀrsenhet; det Àgs av företaget och mÄste hanteras holistiskt och strategiskt för att möta behoven hos kritiska intressenter och för att anpassa sig till breda organisatoriska mÄl. AnvÀndare ska inte behöva oroa sig för var data finns. Data bör vara tillgÀnglig för anvÀndare oavsett var den finns. I slutÀndan bör en datahanteringspolicy vÀgleda din organisations filosofi mot att hantera bÄde strukturerad och ostrukturerad data som en vÀrdefull företagstillgÄng.

DataDecisionMakers

VĂ€lkommen till VentureBeat-communityt!

DataDecisionMakers Àr dÀr experter, inklusive tekniska personer som arbetar med data, kan dela datarelaterade insikter och innovation.

Om du vill lĂ€sa om banbrytande idĂ©er och aktuell information, bĂ€sta praxis och framtiden för data- och datateknik, gĂ„ med oss ​​pĂ„ DataDecisionMakers.

Du kan till och med övervÀga att bidra med en egen artikel!

LÀs mer frÄn DataDecisionMakers