Open source MLOps ramverk ZenML samlar in $2,7 miljoner

Akkio uppdaterar no-code AI-plattform med Snowflake-integration


MĂŒnchen-baserade ZenML, en startup som tillhandahĂ„ller ett utbyggbart MLOps-ramverk med öppen kĂ€llkod för att pĂ„skynda och förenkla leveransen av maskininlĂ€rningsmodeller, samt forskning och produktion, tillkĂ€nnagav idag att den har samlat in 2,7 miljoner dollar i en startrunda av finansiering. Företaget planerar att anvĂ€nda investeringen, som leddes av Crane Venture Partners och flera framstĂ„ende AI-forskare, för att stĂ€rka sitt teknikteam och ytterligare bygga ut sin verktygssvit för datavetare.

Trots det stÀndigt förÀnderliga MLOps-landskapet fortsÀtter processen att ta ett maskininlÀrningsprojekt till produktions- eller livemiljöer att vara svÄr. Till skillnad frÄn traditionella applikationer medför ML-system mycket komplexitet med beroende av bÄde kod och data. Data, i synnerhet, Àr svÄra att brÄka om och kan förÀndras pÄ förvÀntade sÀtt, vilket pÄverkar modellens prestanda. Som ett resultat mÄste datavetenskapsteam hantera en störtflod av verktygsalternativ och processer för att skicka sin modell, vilket inte bara ökar förvirringen och fragmenteringen utan ocksÄ krÀver flera fÀrdigheter.

“De flesta verktyg separerar arbetsflöden i öar som huvudsakligen koncentrerar sig pĂ„ den tidiga utvecklingsfasen för datavetare, eller den senare implementeringsfasen, som till stor del Ă€gs av ingenjörer. Detta orsakar systemfel i hela systemet som en brist pĂ„ reproducerbarhet eller hĂ€rkomst över hela pipelinen, sĂ€ger Hamza Tahir, medgrundare av ZenML, till Venturebeat.

Ett standardiseringslager för MLOps

För att lösa just detta problem startade Tahir ZenML med Adam Probst i juli 2021. Startupen erbjuder ett verktygs- och infrastrukturagnostisk ramverk som fungerar som ett standardiseringslager och lÄter datavetare iterera pÄ lovande idéer och skapa produktionsfÀrdiga pipelines för maskininlÀrning.

ZenMLs ramverk Àr tillgÀngligt som ett lÀttvikts Python-bibliotek och gör det möjligt för datavetare att uttrycka sina ML-arbetsflöden som pipelines. Stegen inom kan definieras som enkla Python-funktioner som skulle kunna hantera godtyckliga uppgifter som att förbearbeta data eller trÀna en modell. Teams kunde sedan enkelt koppla in och spela upp sina infrastruktur- och verktygsbehov direkt i sin ML-pipeline, med nÄgra enkla konfigurationsÀndringar.

“Med ZenML kommer varje ML-projekt att ha samma anvĂ€ndarupplevelse som ett enkelt Python-projekt. Den enda skillnaden Ă€r att du arbetar med riktiga anvĂ€ndningsfall för maskininlĂ€rning som omedelbart kan tas i produktion. Ingen kommer att behöva göra det tunga arbetet med att sĂ€tta upp infrastrukturer eller koordinera mellan DevOps-team och dataforskare, sĂ€ger Tahir.

Differentiering

Medan verktyg för automatisering av arbetsflöden Àr tillgÀngliga för att lÄta anvÀndare definiera arbetsflöden som pipelines, inklusive spelare som Airflow, Prefect och Luigi, hÀvdar ZenML att de sÀrskiljer sig genom att behandla ML-specifika artefakter som modeller, datadrift och funktionsstatistik som förstklassiga medborgare . Ramverket erbjuder sedan datavetare en vÀg att lösa komplexa problem som reproducerbarhet och versionshantering av data, kod och modeller.

“De hĂ€r verktygen Ă€r byggda pĂ„ en svĂ„rbegriplig syntax, som ofta kan vara skrĂ€mmande för dataforskarens persona. Vi siktar pĂ„ att göra raka motsatsen (med en enhetlig syntax pĂ„ ett vĂ€lbekant sprĂ„k) sĂ„ att vĂ„ra anvĂ€ndare kan bli mer investerade i att arbeta med sina inbyggda lösningar snarare Ă€n att lĂ€ra sig hur de anvĂ€nder verktyget de anvĂ€nder, sĂ€ger Tahir.

Även om ZenML fortfarande Ă€r i de tidiga utvecklingsstadierna, hĂ€vdar företaget att de har sett en enorm respons, med över 1 000 GitHub-stjĂ€rnor och nedladdningar som vĂ€xer med 20 % till 40 % varje vecka. Man har ocksĂ„ framgĂ„ngsrikt hanterat betalda projekt frĂ„n Airbus Defence and Space, med fokus pĂ„ objektdetektering pĂ„ nya högupplösta satellitbilder.

“Under de senaste mĂ„naderna har vi skrivit om ZenML-kodbasen för att vara mer robust och anvĂ€ndarvĂ€nlig, sa Tahir. “Vi har ocksĂ„ tredubblat vĂ„rt team inom loppet av nĂ„gra mĂ„nader och slĂ€ppt ZenML 0.5 som inkluderar stöd för att skriva pipelines med standardartefakter som Tensorflow eller PyTorch-modeller med Kubeflow.”

Företaget planerar att utöka sitt team av MLOps-teknologer och utöka ramverket genom att integrera fler verktygsbibliotek för att matcha behoven hos datavetenskapsteam över organisationer. Detta skulle inkludera bibliotek som Evidently/WhyLogs/GreatExpectations för validering och BentoML/Seldon/KServe för distribution.

VentureBeats uppdrag ska vara ett digitalt stadstorg för tekniska beslutsfattare att fÄ kunskap om transformativ företagsteknik och handla. LÀs mer om medlemskap.