AI-forskare utmanar en robot att Ă„ka skateboard i simulering

AI-forskare utmanar en robot att Ă„ka skateboard i simulering

AI-forskare sÀger att de har skapat en ram för att kontrollera fyrbenta robotar som lovar bÀttre energieffektivitet och anpassningsförmÄga Àn mer traditionell modellbaserad gÄngkontroll av robotben. För att visa den robusta karaktÀren av ramverket som anpassar sig till förhÄllandena i realtid fick AI-forskare systemet att glida pÄ friktionsfria ytor för att efterlikna en bananskal, Äka pÄ en skateboard och klÀttra pÄ en bro medan de gick pÄ ett löpband. En Nvidia-talesman sa till VentureBeat att endast det friktionsfria ytprovet genomfördes i verkligheten pÄ grund av begrÀnsningar för kontorspersonalens storlek pÄ grund av COVID-19. Talsmannen sa att alla andra utmaningar Àgde rum i simulering. (Simuleringar anvÀnds ofta som trÀningsdata för robotiksystem innan dessa system anvÀnds i verkligheten.)

”VĂ„rt ramverk lĂ€r sig en styrenhet som kan anpassa sig till utmanande miljöförĂ€ndringar i farten, inklusive nya scenarier som inte ses under trĂ€ning. Den inlĂ€rda styrenheten Ă€r upp till 85% mer energieffektiv och Ă€r mer robust jĂ€mfört med baslinjemetoder, ”lĂ€ser tidningen. “Vid sluttid behöver högnivĂ„styrenheten endast utvĂ€rdera ett litet neuronĂ€tverk i flera lager, vilket undviker anvĂ€ndning av en dyr modell för prediktiv kontroll (MPC) -strategi som annars kan krĂ€vas för att optimera för lĂ„ngsiktig prestanda.”

Fyrkantsmodellen utbildas i simulering med ett löpband med delat bÀlte med tvÄ spÄr som kan Àndra hastighet oberoende av varandra. Den trÀningen i simulering överförs sedan till en Laikago-robot i den verkliga vÀrlden. Nvidia slÀppte video av simuleringar och laboratoriearbete pÄ mÄndagen, dÄ den ocksÄ presenterade AI-driven videokonferenstjÀnst Maxine och den Omniverse-simulerade miljön för ingenjörer i beta.

Ett papper som beskriver ramverket för styrning av fyrfotade ben publicerades för en vecka sedan pÄ preprint repository arXiv. AI-forskare frÄn Nvidia; Caltech; University of Texas, Austin; och Vector Institute vid University of Toronto bidrog till uppsatsen. Ramverket kombinerar en högnivÄkontrollant som anvÀnder förstÀrkningslÀrande med en modellbaserad lÀgre nivÄkontroll.

“Genom att utnyttja fördelarna med bĂ„da paradigmen fĂ„r vi en kontaktadaptiv styrenhet som Ă€r mer robust och energieffektiv Ă€n de som anvĂ€nder en fast kontaktsekvens”, lĂ€ser tidningen.

Forskare hÀvdar att ett antal nÀtverk för att kontrollera robotben Àr fasta och dÀrför inte kan anpassa sig till nya omstÀndigheter, medan adaptiva nÀtverk ofta Àr energiintensiva. De sÀger att rörelsessystem som skapats med förstÀrkningslÀrande ofta Àr mindre robusta Àn modellbaserade metoder, behöver mycket trÀningsprover eller anvÀnder en komplicerad metod för att belöna agenter.

Tidigare i Ă„r pĂ„ International Conference on Robotics and Automation (CRA), AI forskare frĂ„n ETH ZĂŒrich detaljerade DeepGait, AI trĂ€nade med förstĂ€rkning lĂ€rande att göra saker som att överbrygga ovanligt lĂ„nga luckor och gĂ„ pĂ„ ojĂ€mn terrĂ€ng.