Un grupo de neurocientíficos del Instituto McGovern para la investigación del cerebro del Instituto Tecnológico de Massachussett (MIT) han descubierto una red computacional entrenada para identificar los rostros y los objetos, que dispone de una estrategia similar al cerebro para clasificarlos a todos. Este hallazgo permitiría mejorar los sistemas de reconocimiento facial.
Hace más de 20 años, un grupo de investigadores del MIT descubrieron un pequeño punto en el lóbulo temporal del cerebro que responde específicamente a las caras. Esta región, a la que llamaron área fusiforme de la cara, es una de las muchas regiones del cerebro que están dedicadas a tareas específicas, como la detección de palabras escritas, la percepción de canciones vocales y la comprensión del lenguaje.
No se sabe cómo surge la maquinaria de procesamiento de rostros en un cerebro en desarrollo, pero según los hallazgos del MIT, las redes no necesariamente requieren de un mecanismo innato de procesamiento de rostros para adquirir esa especialización. Los científicos no construyeron nada superficial en la red, sino que las redes lograron segregarse sin recibir un empujón específico para la cara.
Entrenamiento de la red neuronal
Para la investigación, publicada en Science Advances, se recopilaron cientos de miles de imágenes con las que entrenar una red neuronal profunda en el reconocimiento de rostros y objetos. La colección incluía los rostros de más de 1.700 personas diferentes y cientos de diferentes tipos de objetos, desde sillas hasta hamburguesas con queso. Todos estos fueron presentados a la red, sin pistas sobre cuál era cuál.
A medida que el programa aprendió a identificar los objetos y rostros, se organizó en una red de procesamiento de información que incluía unidades específicamente dedicadas al reconocimiento de rostros.
Al igual que el cerebro, esta especialización se produjo durante las últimas etapas del procesamiento de imágenes. Tanto en el cerebro como en la red artificial, los primeros pasos en el reconocimiento facial involucran una maquinaria de procesamiento de visión más general, y las etapas finales se basan en componentes dedicados al rostro.