El Premio ACM en Informática de este año se otorga a un especialista en aprendizaje automático cuyo trabajo, incluso si no ha oído hablar de él, es probable que le resulte familiar.
Pieter Abbeel, profesor de UC Berkeley y cofundador de la compañía de robótica de IA Covariant, recibió el premio y su recompensa de $250,000, que se otorga a aquellos en el campo del aprendizaje automático “cuyas contribuciones a la investigación tienen un impacto fundamental y amplias implicaciones”.
Abbeel es profesor de informática e ingeniería eléctrica cuyo trabajo ya ha recibido cierto reconocimiento. Junto con este nuevo premio, MIT Technology Review lo nombró uno de los mejores jóvenes innovadores menores de 25 años y ganó un premio otorgado a la mejor tesis doctoral de EE. UU. en robótica y automatización.
Pieter Abbeel, ganador del premio informático ACM 2021
ACM dijo que Abbeel fue un pionero en el aprendizaje y el aprendizaje por refuerzo, y destacó un robot doblador de ropa que diseñó y que podía manipular mejor los objetos deformables. También contribuyó al desarrollo de máquinas que podían atar suturas y detectar trayectorias de objetos.
Además, Abbeel contribuyó al desarrollo de la optimización de políticas de región de confianza, el aprendizaje de imitación de una sola vez, la aleatorización de dominios, la repetición de experiencias retrospectivas, la estimación de ventajas generalizadas y el algoritmo de aprendizaje de refuerzo conocido como crítico de actor suave.
Covariant, la compañía de Abbeel, también ha logrado avances, incluso en 2020 cuando desarrolló un brazo robótico capaz de clasificar equipos más rápido que los humanos.
ACM dijo que una de las contribuciones más importantes de Abbeel al mundo del aprendizaje automático fue su trabajo con el aprendizaje de refuerzo profundo, que combina el aprendizaje de refuerzo con redes neuronales profundas. “Si bien los primeros programas de aprendizaje por refuerzo eran efectivos, solo podían realizar tareas simples… el aprendizaje por refuerzo profundo puede resolver problemas mucho más complejos que los programas de computadora desarrollados solo con el aprendizaje por refuerzo”, dijo ACM.
El aprendizaje de refuerzo profundo permite que la IA aprenda más rápidamente con menos conocimiento previo porque puede aprender de datos abstractos y no estructurados de manera más efectiva. El enfoque se usó en aplicaciones de alto perfil, como aprender a vencer a los humanos en Go, Ajedrez y Póquer, y otras implican mejorar las notificaciones de las redes sociales y entrenar autos sin conductor.
Algunos sostienen alternativamente que el aprendizaje de refuerzo profundo es un paradigma del aprendizaje automático y un proceso poco práctico incapaz de duplicar la realidad con precisión.
El ingeniero de software de Google, Alex Irpan, escribió en 2018 que Deep RL sufría de su necesidad característica de una gran cantidad de datos para generar resultados, algo de lo que puede no tener la ventaja en las aplicaciones del mundo real. ®