La Startup de IA “Embodied Intelligence” quiere que los robots aprendan de los seres humanos usando la realidad virtual

Por Martín GS |

Publicado a las 09:20 PM CST en Nov 9,2017 | Actualizado a las 09:20 PM CST en Nov 9,2017


Dependiendo de a quién se pregunte, el agarre robótico se ha resuelto desde hace tiempo. Es decir, el acto de agarrar físicamente un objeto, no dejarlo caer, y luego hacer algo útil es algo con lo que los robots se sienten cómodos. La parte difícil es decidir qué y cómo agarrar, y eso puede ser muy, muy difícil, especialmente fuera de un entorno estructurado.

Este es un problema definitorio para la robótica en este momento: los robots pueden hacer todo lo que quieras, siempre y cuando les digas exactamente qué es eso, cada vez. En una fábrica en la que los robots están haciendo exactamente lo mismo una y otra vez, esto no es tanto un problema, sino que lanza algo nuevo o diferente a la mesa, y se convierte en un enorme dolor de cabeza.

Durante los últimos años, investigadores como Pieter Abbeel en UC Berkeley han estado desarrollando formas de enseñarles a los robots nuevas habilidades, en lugar de acciones, y cómo aprender, en vez de simplemente obedecer. Esta semana, Abbeel y varios de sus colegas de la UC Berkeley y OpenAI anuncian una nueva puesta en marcha (con 7 millones de dólares en financiación inicial) llamada Embodied Intelligence, que “permitirá a los brazos robóticos industriales percibir y actuar como humanos en lugar de limitarse a seguir trayectorias preprogramadas”.

Un pequeño resumen de lo que Embodied tiene en mente, de su comunicado de prensa:

Estamos construyendo tecnología que permite a los robots existentes manejar una gama mucho más amplia de tareas donde las soluciones actuales se descomponen, por ejemplo, el levantamiento de recipientes de formas complejas, embalaje, ensamblaje, despaletización de pilas irregulares y manipulación de objetos deformables como alambres, cables, telas, linos, bolsas de fluidos y alimentos.

Para equipar los robots existentes con estas habilidades, nuestro software se basa en los últimos avances en el aprendizaje de refuerzo profundo y aprendizaje de imitación profunda, a todos los cuales el equipo fundador ha hecho contribuciones significativas. El resultado no es sólo un nuevo conjunto de habilidades en el repertorio de robots, sino robots con capacidad de aprendizaje, que pueden desplegarse para nuevas tareas en un breve plazo de tiempo.

Los antecedentes aquí serán familiares para cualquiera que haya seguido la investigación de Abbeel en el Robot Learning Lab (RLL) de UC Berkeley. Mientras que el plegado de toallas es probablemente la investigación más famosa de RLL, el laboratorio también ha estado trabajando en el aprendizaje adaptativo a través de demostraciones, como con este nudo robótico atado a partir de 2013:

Hay dos cosas importantes que se demuestran aquí. Primero, tienes lo aprendido en la demostración, donde un humano muestra al robot cómo hacer un nudo sin necesidad de programación explícita, y luego generaliza la demostración para aplicar la habilidad que representa a futuras tareas de anudado. Esto lleva a la segunda consideración importante: Como no hay accesorios, la cuerda puede ponerse en en todo tipo de posiciones diferentes, por lo que el robot debe ser capaz de reconocerlo esto y modificar su comportamiento en consecuencia.

Mientras que los humanos pueden hacer este tipo de cosas sin pensar, los robots todavía no pueden, por lo que ha habido una brecha tan grande entre las capacidades de los humanos y los manipuladores robóticos. Embodied quiere cerrar esta brecha con robots que puedan aprender rápida y flexiblemente.

Alrededor del 2012, concluimos que sería realmente difícil llegar a las necesidades del mundo real que queríamos con los enfoques más sofisticados que habíamos estado siguiendo “, dice Abbeel. Luego llegó un gran avance en el campo de la IA: El proyecto ImageNet en Stanford demostró que el aprendizaje podía hacer mucho más de lo que podía hacer antes, si uno estaba dispuesto a recopilar datos suficientes y entrenar una red neuronal profunda y grande para sus tareas.

 

Embodied Intelligence quiere utilizar la IA y la RV para enseñar a los robots nuevas habilidades, como manipular cables, mucho más rápido.

Abbeel y su equipo han estado “forzando el aprendizaje de refuerzo y la imitación aprendiendo bastante duro”, dice,”y hemos llegado a un punto en el que realmente creemos que es el momento adecuado para empezar a poner esto en práctica, no necesariamente para un robot doméstico, que necesita lidiar con una enorme cantidad de variaciones, sino en fabricación y logística”.

Aportamos software que sólo tenemos que escribir una vez, de antemano, para todas las aplicaciones… Eso es un cambio de paradigma de la necesidad a la programación para cada tarea específica a la programación de una sola vez y luego sólo haciendo la recopilación de datos, ya sea a través de demostraciones o mediante el aprendizaje de refuerzo ” -Pieter Abbeel

Se trata de realizar tareas de manipulación repetitiva en las que el estado actual de la técnica de automatización simplemente no es lo suficientemente eficaz, así como tareas que requerirían una reprogramación muy frecuente de los robots. A nivel práctico “, dice Abbeel,” estamos construyendo un sistema de software que puede aprender nuevas habilidades muy, muy rápidamente, lo que lo hace muy diferente de la automatización tradicional “.

La idea es que con un marco de aprendizaje lo suficientemente flexible, la programación se vuelva trivial, porque el robot puede aprender rápidamente nuevas habilidades con sólo un poco de demostración humana al principio. Como explica Abbeel,”La gran diferencia es que traemos software que sólo tenemos que escribir una vez, de antemano, para todas las aplicaciones. Y para que el robot sea capaz de una aplicación específica, todo lo que tenemos que hacer es recopilar nuevos datos para esa aplicación. Eso es un cambio de paradigma que pasa de necesitar a programar para cada tarea específica que te interesa a programar una vez y luego hacer la recopilación de datos, ya sea a través de demostraciones o mediante el aprendizaje de refuerzo “.

Foto: Elena Zhukova/Inteligencia corporal El equipo de Embodied Intelligence : Pieter Abbeel, presidente y jefe científico; Peter Chen, CEO; Rocky Duan, CTO; y Tianhao Zhang, investigador científico.

Enseñar nuevas habilidades al robot es un proceso que ha evolucionado rápidamente en los últimos años. Como se veía en el vídeo de atado de nudos, la forma en que solía hacerlo era moviendo físicamente el robot y pulsando botones de un controlador. La mayoría de los robots industriales trabajan de la misma manera, a través de algún tipo de programa de enseñanza. Es un proceso que consume tiempo y no es particularmente intuitivo, y también crea un vacío entre lo que el robot está experimentando y lo que el maestro humano está experimentando, ya que la perspectiva del ser humano (y de hecho todo el sistema de percepción) es muy diferente a la del robot que se está enseñando.

Basado en algunas investigaciones más recientes en RLL, Embodied está adoptando un nuevo enfoque basado en la realidad virtual. Lo que es realmente interesante es que hemos llegado a un punto en el que la realidad virtual se ha convertido en una mercancía “, dice Abbeel. Lo que eso significa es que en realidad se puede enseñar a los robots cosas en RV, de tal manera que el robot experimenta todo de la forma en que lo experimentará al hacer el trabajo en sí mismo. Es un gran cambio en términos de la calidad de los datos que puedes obtener “.

Debido a que los datos recopilados de esta manera son de gran calidad, enseñar a los robots nuevas habilidades es mucho más rápido. Usted puede leer el artículo aquí, pero enseñar cada una de las tareas en el video de arriba no tomó más de 30 minutos de demostración (y a veces significativamente menos) para lograr altos índices de éxito (en la mitad del 80 por ciento al 90 por ciento). Recuerde, el sistema está aprendiendo una habilidad en lugar de una secuencia de acciones, lo que significa que puede extrapolar para adaptarse a la variabilidad que no fue explícitamente entrenado. Esto es crucial para operar fuera de un entorno de investigación.

Una vez que la fase inicial de demostración ha terminado, el robot probablemente no se esté moviendo tan rápido como lo hace un ser humano, y probablemente tampoco sea tan confiable como un ser humano. Una tasa de éxito del 80 o 90 por ciento es buena para la investigación, pero no es lo suficientemente buena como para que cualquier cliente de fabricación esté de acuerdo con ella para sus robots, especialmente si es lenta. Embodied lo entiende, pero Abbeel dice que los robots mejorarán muy rápidamente:”Puede que no alcance una precisión del 100 por ciento, y puede que no se mueva a la velocidad humana, pero la siguiente fase de aprendizaje perfecciona y acelera la ejecución a través del aprendizaje reforzado, y eso juntos le da una nueva habilidad”.

El equipo de Embodied Intelligence

Embodied se centrará en los tipos de habilidades visuales motoras que los robots actuales no superan, donde usted necesita la retroalimentación visual continua para ejecutar en lo que está haciendo. La manipulación de cables y alambres es un buen ejemplo de esto: si desea que su robot pueda conectar una cosa a otra, tiene que ser capaz de reconocer y agarrar una cosa floja en un lugar y orientación arbitrarios, una habilidad que puede ser difícil de programar explícitamente.

En cuanto a la complejidad de las habilidades que Embodied será capaz de enseñar su sistema, Abbeel dice que realmente depende de lo que es posible hacer en forma remota. La forma en que lo caracterizamos es siempre y cuando un humano pueda teleoperar el robot para hacer el trabajo, entonces debería ser aprendible. Por supuesto, cuanto más compleja sea la tarea, más datos se necesitarán, y eso es lo que vamos a averiguar con el tiempo, cuál es la cantidad de recopilación de datos que se necesita para una tarea dada. Pero, la métrica práctica sería, nos sentamos detrás de nuestro teleoperador, tratamos de hacer una tarea con el robot, si podemos hacerlo, entonces sabemos que va a estar dentro del alcance de lo que podemos proporcionar “.

Cabe mencionar que en este espacio ya hay algunas otras empresas, como Kindred, Kinema Systems y RightHand Robotics, que ofrecen soluciones de manipulación de robots que pueden (en cierta medida) gestionar la variabilidad y adaptarse a las nuevas tareas. Tendremos que esperar a ver qué tan bien se compara la Inteligencia incorporada: Abbeel nos dijo que esperemos algunas demostraciones de vídeo en los próximos meses.


Referencias & Fuentes

embody.ai 

nytimes.comA.I. Researchers Leave Elon Musk Lab to Begin Robotics Start-Up

wired.comWant to Really Teach a Robot? Command It With VR

Si te fue útil, Comparte esta Información
  •  
  •  
  •  
  •  
  •  
    64
    Shares
Mostrar Más

Martín González Soto

Martin González Soto (n. en 1974 en la Santiago de Chile), nacionalizado Español  en 1999, es un profesor de robotica aplicada e informática de la Universidad Libre de Madrid, en España, y un reconocido experto en redes neuronales artificiales e inteligencia artificial. 

Articulos Relacionados

Close