Una nueva dirección en el aprendizaje automático es darle a las computadoras la capacidad de soñar despierto, y los resultados son fascinantes y potencialmente muy útiles.
Un sistema desarrollado por investigadores de Nvidia en Santa Clara, California, puede mirar la imagen de un camino soleado e imaginar, con un detalle sorprendente, cómo luciría si estuviera lloviendo, de noche o nevando. También puede imaginarse cómo sería un gato casero si fuera un leopardo, un león o un tigre.
El software hace uso de un nuevo enfoque popular en AI que permite que las computadoras aprendan sin ayuda humana. El equipo utilizó redes adversas generativas, o GAN, que son redes neuronales que trabajan en conjunto para conocer las propiedades de un conjunto de datos (ver ” Innovadores menores de 35 años: Ian Goodfellow “).
En una GAN, una red neuronal trata de producir datos sintéticos mientras que otra trata de decir si un ejemplo proviene del conjunto de datos reales o no. Los comentarios de la segunda red ayudan a mejorar el rendimiento de la primera. El truco realizado por el equipo de Nvidia es usar dos GAN capacitados en datos diferentes pero similares, y usar similitudes o superposiciones entre los dos modelos entrenados para idear nuevas imágenes.
En el caso de las imágenes de la calle, por ejemplo, un GAN fue entrenado para internalizar las propiedades de las carreteras mientras que el otro fue entrenado usando imágenes de escenas nocturnas, lluviosas o nevadas. Al conectar las dos redes, la computadora puede imaginarse cómo sería una escena en diferentes condiciones. Un truco similar se realizó con gatos domésticos y grandes felinos (puede ver el video completo aquí). Los investigadores están presentando el trabajo en la conferencia de Sistemas de procesamiento de información neuronal en Long Beach, California, esta semana. Aquí hay un documento (PDF) que describe el trabajo.
“Hasta ahora, el aprendizaje automático se ha centrado más en el reconocimiento”, dice Ming-Yu Liu , que trabajó en el proyecto con sus colegas Thomas Breuel y Jan Kautz . “Pero los humanos pueden usar su imaginación. Si te doy una foto en verano, puedes imaginar cómo será cubierto de nieve “.
Liu dice que la tecnología podría tener aplicaciones prácticas en la edición de imágenes y videos, y para agregar efectos realistas a las imágenes y videos publicados en las redes sociales. Imagine poder publicar un video en vivo que le muestre en un entorno artificial muy realista, por ejemplo, o que convierta su rostro en el de otra persona o un animal.
El enfoque también podría ser útil para entrenar sistemas de conducción automática para reconocer más escenarios sin tener que recopilar una cantidad ridícula de datos del mundo real. “En California no tenemos mucha nieve, pero queremos que nuestro auto sin conductor funcione bien en la nieve”, dice Liu.