Robótica

Robôs aprendem diferentes comportamentos de locomoção usando demonstrações humanas

Robôs aprendem diferentes comportamentos de locomoção usando demonstrações humanas


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Os robôs são uma parte importante do nosso futuro, e pesquisadores ao redor do mundo têm trabalhado arduamente para possibilitar estilos de locomoção suaves em robôs humanóides e com pernas.

Agora, uma equipe de pesquisadores da Universidade de Edimburgo, na Escócia, montou uma estrutura para treinar robôs humanóides para andar como nós, humanos, usando demonstrações humanas.

Seu estudo foi pré-publicado em arXiv, e combina técnicas de aprendizagem por imitação e aprendizagem por reforço profundo. Suas descobertas também foram publicadas em IEEE Xplore.

VEJA TAMBÉM: O ROBÔ HUMANOIDE MAIS AVANÇADO DO IRÃO RIVALS O ASIMO DE HONDA

Conhecimento humano útil em sistemas de robôs

"A questão principal que propusemos investigar foi como incorporar (1) conhecimento humano útil na locomoção de robôs e (2) dados de captura de movimento humano para imitação no paradigma de aprendizado de reforço profundo para avançar as capacidades autônomas de robôs com pernas de forma mais eficiente", Chuanyu Yang, um dos pesquisadores que participaram do estudo, disse TechXplore.

"Propusemos dois métodos de introdução do conhecimento humano anterior em uma estrutura DRL."

A estrutura da equipe funciona a partir de um design de recompensa exclusivo que utiliza dados de legenda de movimento de humanos caminhando como parte do processo de treinamento. Ele então combina isso com duas arquiteturas neurais hierárquicas especializadas: uma rede neural de função em fases (PFNN) e uma rede neural adaptativa de modo (MANN).

"A chave para replicar estilos de locomoção semelhantes aos humanos é apresentar dados de caminhada humana como uma demonstração de especialista para o agente de aprendizagem imitar", explicou Yang. "O projeto de recompensa é um aspecto importante da aprendizagem por reforço, pois governa o comportamento do agente."

Você não pode deixar de pensar nas semelhanças de treinar um cão para realizar truques e recompensá-lo com um osso depois ...

A notícia maravilhosa sobre a estrutura da equipe era que ela até permitia que robôs humanóides operassem em terreno irregular ou empurrões externos.

As descobertas da equipe sugerem que as demonstrações de especialistas, como humanos andando, podem aprimorar muito as técnicas de aprendizado de reforço profundo para treinar robôs em vários estilos de locomoção diferentes. No final das contas, esses robôs poderiam se mover tão rápida e facilmente quanto os humanos, ao mesmo tempo em que alcançavam comportamentos mais naturais e semelhantes aos humanos.

No momento em que toda a pesquisa está sendo realizada por meio de simulação, os próximos passos envolvem experimentar o framework na vida real.

"Em nosso trabalho futuro, também planejamos estender a estrutura de aprendizagem para imitar um conjunto mais diversificado e complexo de movimentos humanos, como habilidades motoras gerais durante a locomoção, manipulação e preensão", disse Yang.


Assista o vídeo: Phillip u0026 Holly Interview This Mornings First Robot Guest Sophia. This Morning (Junho 2022).


Comentários:

  1. Tojazuru

    Envie -me um email para PM, vamos conversar.

  2. Eagan

    Só ouse mais uma vez para fazê -lo!

  3. Keon

    Muito bem, esta é a ideia simplesmente excelente

  4. Riccardo

    Sinto muito, mas acho que você está errado. Eu posso provar. Envie -me um email para PM.

  5. Machaon

    Eu excluí esta pergunta



Escreve uma mensagem