Google apresenta a “Constituição da Robótica” para melhorar a tomada de decisões de droids de IA

Num movimento inovador, a equipe de robótica DeepMind do Google introduziu três avanços significativos destinados a melhorar as capacidades de tomada de decisão dos robôs que operam em ambientes externos. Entre essas inovações está um sistema único de coleta de dados de treinamento, acompanhado pelo que o Google chama de “Constituição do Robô”. Espera-se que este desenvolvimento permita que os robôs tomem decisões mais rápidas, inteligentes e seguras enquanto trabalham ao lado de humanos.

AutoRT: um sistema avançado de coleta de dados

O AutoRT da DeepMind é um sistema de coleta de dados de última geração projetado para dar aos robôs a capacidade de compreender o ambiente ao seu redor, adaptar-se a novas situações e selecionar as tarefas mais adequadas. Ele aproveita um modelo de linguagem visual (VLM) e um modelo de linguagem grande (LLM) que funcionam em harmonia.

O VLM é responsável por perceber o ambiente do robô e identificar objetos visíveis. Enquanto isso, o LLM atua como tomador de decisões, sugerindo tarefas que o robô pode realizar. Essa abordagem de modelo duplo permite que os robôs façam escolhas informadas e naveguem pelo ambiente com mais eficiência.

Inspirado nas "Três Leis da Robótica" de Asimov.

A Constituição do Robô, inspirada nas “Três Leis da Robótica”, do visionário escritor de ficção científica Isaac Asimov, funciona como um conjunto de diretrizes de segurança para robôs artificialmente inteligentes. Esta constituição instrui o LLM a evitar tarefas que envolvam humanos, animais, objetos pontiagudos e aparelhos elétricos, garantindo a segurança tanto dos robôs como dos seus homólogos humanos.

Medidas de segurança reforçadas

A DeepMind tomou precauções adicionais para melhorar a segurança desses robôs. Se a força nas articulações de um robô exceder um limite predeterminado, o robô irá parar automaticamente. Além disso, um interruptor físico de interrupção está disponível para operadores humanos, permitindo-lhes desativar os robôs quando necessário, proporcionando uma camada adicional de segurança.

Teste e implantação no mundo real

No espaço de apenas sete meses, o Google implantou com sucesso cinquenta e três robôs AutoRT em quatro edifícios de escritórios. Durante este tempo, realizaram mais de setenta e sete mil testes para testar as capacidades dos robôs. Alguns desses robôs eram controlados remotamente por operadores humanos, enquanto outros seguiam scripts predefinidos ou operavam de forma autônoma usando o modelo de aprendizagem de IA do Robotic Transformer (RT-2) do Google.

Em particular, estes robôs têm um aspecto prático, equipados com uma câmara, um braço robótico e uma base móvel. O Modelo de Linguagem Visual (VLM) é crucial para ajudá-los a compreender o que está ao seu redor e identificar objetos, enquanto o Modelo de Linguagem Grande (LLM) auxilia na tomada de decisões, garantindo que os robôs executem as tarefas de forma eficaz e segura.

Apresentação do SARA-RT: um avanço em termos de eficiência

Um dos avanços mais significativos neste esforço é a introdução da Atenção Robusta Autoadaptativa para Transformadores Robóticos (SARA-RT). Este sistema foi desenvolvido para otimizar modelos de Robotics Transformer (RT), tornando-os mais eficientes em aplicações do mundo real.

A arquitetura da rede neural RT, que desempenhou um papel crítico nos últimos avanços em sistemas de controle robóticos, especialmente o modelo de ponta RT-2, teve melhorias significativas. Os modelos SARA-RT-2 de alto desempenho demonstraram uma melhoria notável de 10,6% na precisão e um aumento de 14% na velocidade em relação aos seus equivalentes RT-2, tudo isso usando um histórico de imagem conciso como entrada.

Um ponto de viragem para a eficiência da robótica

A introdução do SARA-RT é considerada um ponto de viragem no campo da robótica. Representa o primeiro mecanismo de atenção escalável que melhora significativamente a eficiência computacional sem comprometer a qualidade da tomada de decisão. Este desenvolvimento pretende revolucionar a forma como os robôs operam em cenários do mundo real, tornando-os mais capazes, eficientes e seguros.

Os recentes avanços da equipe de robótica DeepMind do Google em robótica orientada por IA, incluindo a introdução de uma "Constituição Robótica" e o inovador sistema SARA-RT, marcam um avanço significativo no mundo da robótica. Espera-se que estas inovações melhorem as capacidades de tomada de decisão dos robôs em ambientes exteriores, tornando-os mais inteligentes, mais seguros e mais eficientes. Com testes no mundo real e resultados impressionantes, o compromisso do Google com o avanço no campo da robótica é claro, prometendo um futuro onde robôs e humanos possam colaborar de forma contínua e segura.