•huggingface.co•
1 visualizações
NVIDIA lança Política Cosmos para controle avançado de robôs, novos benchmarks em manipulação - huggingface.co
NVIDIA anunciou Cosmos, família de modelos de fundação visual para controle de robôs. São transformers de ação visual pré-treinados em 1 bilhão de tokens de Open X-Embodiment (800k+ trajetórias de 60+ robôs), 100M+ clipes do YouTube com ações estimadas e dados sintéticos. Prevê observações visuais futuras dada observação atual e ações. Alcança SOTA zero-shot em RT-1-X (0.85, vs 0.63 RT-2 e 0.72 OpenVLA) e CALVIN (0.71, vs 0.45 e 0.58). Disponível no Hugging Face Hub com código e demo.