Ahana går djupt in på AWS för att hjälpa Presto-användare att ställa in och fråga efter säkra datasjöar

Ahana går djupt in på AWS för att hjälpa Presto-användare att ställa in och fråga efter säkra datasjöar


Ahana, ett företag som kommersialiserar frågemotorn Presto SQL med öppen källkod, har tillkännagett en ny molnintegration med AWS Lake Formation, en helt hanterad tjänst som gör det möjligt för Amazons molnkunder att snabbt sätta upp datasjöar.

Integrationen är en del av ett kommande AWS Lake Formation-partnerprogram, som Amazon förväntas lansera formellt under de kommande veckorna.

Ahana grundades i april 2020 och presenterar sig själv som det första företaget som lanserar Presto-baserad ad hoc-analys på marknaden. Presto, för den oinvigde, utvecklades internt på Facebook för ett decennium sedan som ett sätt att hjälpa sina datavetare och analytiker att köra snabbare frågor på mastodontuppsättningar. Den sociala nätverksjätten öppnade Presto med öppen källkod 2013, och under åren som följde lämnade Prestos första skapare företaget för att lansera en gaffel som heter PrestoSQL som nyligen döptes om till Trino. Skaparna lanserade också en separat kommersiell enhet som heter Starburst.

Kort sagt, det finns nu i praktiken två huvudinstanser av Presto. Den ursprungliga Presto, på med Ahana är byggd, faller under beskydd av den Linux Foundation-värd Presto Foundation, som räknar Facebook, Uber, Twitter och Alibaba som grundande medlemmar.

Att lösa komplexitet

Medan Presto √§r ett kraftfullt verktyg f√∂r att s√∂ka i b√•de relations- och NoSQL-databaser, datalager och datasj√∂ar, kan det vara komplext ur konfigurations- och hanteringssynpunkt – det √§r h√§r Ahana kommer in i striden. Det San Mateo, Kalifornien-baserade f√∂retaget lanserade sin f√∂rsta kommersiella produkt i september f√∂rra √•ret – Ahana Cloud √§r i grunden “Presto-as-a-service”, vilket underl√§ttar drifts√§ttningen och integrationen av Presto med AWS f√∂r f√∂retag att fr√•ga sina AWS S3-datasj√∂ar.

Företag använder en datakatalog som AWS Glue för att förenkla data som lagras på S3 (en Amazon-lagringstjänst som ofta används som en datasjö), och översätter data till relationsstrukturer (t.ex. tabeller) som sedan kan frågas av en applikation.

Medan Ahana redan arbetar med Glue och S3 för att fråga företags datasjöar, lanserade Amazon AWS Lake Formation redan 2019, designad för att hjälpa företag att sätta upp och hantera datasjöar på bara några dagar. Detta inkluderar intag, katalogisering, rengöring och omvandling av all deras data som finns på S3. AWS Lake Formation lägger till ett antal särskilt anmärkningsvärda funktioner till den grundläggande S3-datasjön, inklusive förenklad säkerhetshantering, och bara förra veckan lade AWS till fler säkerhetsfunktioner till mixen, inklusive möjligheten att genomdriva åtkomstkontroller för enskilda rader och celler i tabeller.

I slutändan, genom att integrera direkt med AWS Lake Formation, låter Ahana nu sina kunder utnyttja alla dessa ytterligare funktioner.

“V√•r verksamhet √§r beroende av att tillhandah√•lla analyser √∂ver en rad datak√§llor f√∂r v√•ra kunder, s√• det √§r viktigt att vi tillhandah√•ller b√•de en transparent och s√§ker upplevelse f√∂r dem”, s√§ger Ameer Elkordy, ledande dataingenj√∂r p√• AI-mobilitetsf√∂retaget och Ahana-kund Metropolis. “Vi anv√§nder Amazon S3 som v√•r datasj√∂ och Ahana Cloud f√∂r Presto f√∂r ad hoc-fr√•gor p√• den datasj√∂n. Nu, med Ahana och AWS Lake Formation-integrationen, f√•r vi √§nnu mer detaljerad s√§kerhet med data√•tkomstkontroll som √§r l√§tt att konfigurera och inbyggt i v√•r AWS-stack.‚ÄĚ

Ahanas medgrundare och produktchef Dipti Borkar tillade att innan denna integration var säkerhetsåtkomsten inte lika detaljerad

“Dataplattformsteam hade inte ett alternativ att kontrollera vem som hade tillg√•ng till vilken data”, sa Borkar till VentureBeat. “V√•ra kunder kommer att kunna fr√•ga data p√• en AWS S3-datasj√∂ och till√§mpa alla s√§kerhetspolicyer som definieras i AWS Lake Formation – detta kommer att ge dataplattformsteam strikt styrning av sina datasj√∂ar.”

Hej Presto

Det har varit ett hektiskt √•r i Presto-utrymmet. Ahana sj√§lv avslutade nyligen en finansieringsrunda p√• 20 miljoner dollar fr√•n en m√§ngd investerare som inkluderade Alphabets riskkapitalarm GV. Och Starburst ‚Äď den kommersiella enheten bakom Presto-avl√§ggaren Trino ‚Äď samlade in 100 miljoner dollar till en enorm v√§rdering p√• 1,2 miljarder dollar.

Så finns det plats för två företag som är dedikerade till att kommersialisera en Presto-baserad SQL-frågemotor? Att stora investerare som GV, Andreessen Horowitz, Coatue och Salesforce plöjer sina pengar på sådana som Ahana och Starburst tyder på att det finns. Dessutom tyder alla signaler på att det inte kommer att finnas ett scenario där vinnaren tar allt, med tanke på Ahana/Prestos och Starburst/Trinos distinkta fokus.

Girish Baliga, senior ingenjörschef på Uber och ordförande för Presto Foundations styrelse, erkände att även om det finns flera SQL-motorer där ute, går Presto en väg som till stor del är fokuserad på datasjöar.

“Med √∂ppen k√§llkod skiljer sig projekt ofta utifr√•n deras filosofier – f√∂r Presto √§r v√•rt fokus datasj√∂n och att bygga den snabbaste √∂ppen k√§llkodsmotorn f√∂r det, med visst fokus p√• federation”, sa han till VentureBeat. ‚ÄĚAndra projekt kan ha andra inriktningar. Med tiden tror vi att datasj√∂n √§r d√§r de flesta data kommer att finnas.‚ÄĚ

Dessutom har Ahana valt att erbjuda hanterade tjänster för en enda molnleverantör (AWS) för tillfället, även om det är värt att notera att Presto kan distribueras var som helst, och Ahana hjälper företag att göra just det genom sitt deltagande i öppen källkodsgemenskapen.

“Ahana √§r fokuserad p√• Presto f√∂r AWS av tv√• viktiga sk√§l,” tillade Borkar, som ocks√• fungerar som ordf√∂rande f√∂r Presto Foundations upps√∂kande kommitt√©. “AWS har de mest avancerade datarelaterade tj√§nsterna, och majoriteten av marknaden finns d√§r. Ur ett hanterad tj√§nsteperspektiv k√∂r vi p√• Kubernetes och anv√§nder en in-VPC-distributionsmetod som separerar kontrollplanet och ber√§kningsplanet, vilket g√∂r det mycket portabelt och multimolnv√§nligt.‚ÄĚ

Borkar bekräftade också att de planerar att utöka sina hanterade tjänster till andra moln i framtiden.

Starbursts pitch √§r att medan Presto byggdes “f√∂r att l√∂sa hastighet och kostnadseffektivitet f√∂r data√•tkomst i massiv skala” hos f√∂retag som Facebook och Uber, √§r Trino designad f√∂r att ge Prestos kraft till ett “brett spektrum av f√∂retag i olika stadier av molnadoption.‚ÄĚ Bara f√∂rra veckan lanserade Starburst en helt hanterad cross-cloud analytics-tj√§nst som g√∂r det m√∂jligt f√∂r f√∂retag att s√∂ka efter data som finns p√• n√•gon av de “tre stora” infrastrukturerna utan att flytta data fr√•n sin ursprungliga plats.

Slutligen, en av de troliga anledningarna till att Prestos ursprungliga skapare ändrade namn på PrestoSQL-gaffeln som Trino var att säkerställa att det inte fanns någon kvardröjande förvirring mellan de två varumärkena med öppen källkod. Och detta pekar på ett annat potentiellt försäljningsargument för Presto Рur marknadsföringssynpunkt om inte annat.

“Det finns bara en Presto – det finns m√•nga gafflar av Presto, men de √§r inte Presto,” sa Borkar. ‚ÄúPresto √§r ett community-drivet projekt under Linux Foundation. Det √§r h√§r Kubernetes och Node och andra fantastiska projekt bor. Presto √§r det som k√∂rs p√• Facebook p√• tusentals och √•ter tusentals noder; Presto √§r det som testas och valideras i stor skala; Presto √§r det som anv√§nds av h√§lften av Ubers anst√§llda p√• m√•nadsbasis.”

VentureBeats uppdrag ska vara ett digitalt stadstorg för tekniska beslutsfattare att få kunskap om transformativ företagsteknik och handla. Läs mer om medlemskap.