Googles DeepMind har lanserat två nya AI-modeller utformade för att hjälpa bots att utföra fler verkliga uppgifter.

En av dem, kallad Gemini Robotics, är en visuell handlingsmodell som gör det möjligt för robotar att förstå nya situationer utan att vara specifikt utbildade.
Gemini Robotics är baserad på Googles senaste version av sin flaggskepp AI -modell, Gemini 2. 0. Carolina Parad, seniorchef för robotik på Googles DeepMind, har sagt att Gemini -robotik förlitar sig på Tvillingarna på multimodal världsförståelse för att tillämpa dem på den verkliga världen genom att lägga till nya metoder för fysisk handling.
Modellen gör framsteg i vad Google DeepMind anser är de tre kärnområdena som behövs för att bygga effektiva bots: mångsidighet, interaktivitet och flexibilitet. Förutom att kunna hantera nya situationer är Gemini -robotik bättre på att interagera med människor och miljön och kan utföra mer exakta fysiska operationer, till exempel vikbara papper eller öppningsflaskhattar.
Den andra är Gemini Robotics-ER (representativ resonemang), som företaget kallar en avancerad visuell språkmodell som kan "förstå komplexa och dynamiska världar."
Parada förklarar vidare att när du packar en Bento -låda måste du överväga var och hur du gör det på bordet. Gemini Robotics-ER är designad för denna typ av inferensuppgift, vilket gör att robotister kan gränssnitt med befintliga lågnivåkontrollsystem och låsa upp nya kapaciteter som drivs av Gemini Robotics-ER.
Vikas Sindhwani, forskare på Googles DeepMind, sa att företaget utvecklade en "skiktad säkerhetsstrategi" och sa att Gemini Robotics-ER-modellen hade utbildats för att bedöma om en åtgärd var säker i en given situation. Företaget har också släppt nya riktmärken och ramar för att främja säkerhetsforskning inom AI. Enligt IT House lanserade Google DeepMind förra året "Robot Constitution", som är en uppsättning robotbeteende normer inspirerade av Isaac Asimov.
Enligt utländska medier The Verge har Googles DeepMind samarbetat med Apptronik för att "bygga nästa generation humanoidrobotar". Dessutom har Google öppnat Gemini Robotics-ER-modellen för "pålitliga testare" inklusive smidiga robotar, agility-robotik, Boston-dynamik och förtrollade verktyg. "Vi är fokuserade på att bygga intelligens som förstår och agerar i den fysiska världen, och vi ser mycket fram emot att tillämpa denna teknik över flera domäner och flera manifestationer," sade Parada. "
