Un grupo de investigadores del Instituto Tecnológico de Massachussets (MIT) trabaja en un sistema de aprendizaje automático que es capaz de realizar sus cálculos basándose en el movimiento de la luz, en lugar de los electrones, utilizando cientos de láseres de escala micrométrica. Según los investigadores, el nuevo sistema ofrece una mejora de más de 100 veces en la eficiencia energética y una mejora de 25 veces en la densidad informática, una medida de la potencia de un sistema en comparación con las computadoras digitales de última generación para el aprendizaje automático.
Las redes neuronales profundas (DNN) se basan en enormes modelos de aprendizaje automático que simulan cómo el cerebro procesa la información. Sin embargo, las tecnologías digitales detrás de las DNN actuales están llegando a sus límites incluso cuando el campo del aprendizaje automático está creciendo. Además, requieren enormes cantidades de energía y se limitan en gran medida a grandes centros de datos. Esto está motivando el desarrollo de nuevos paradigmas informáticos.
El uso de luz en lugar de electrones para ejecutar cálculos DNN tiene el potencial de superar los cuellos de botella actuales. Los cálculos que utilizan la óptica, por ejemplo, tienen el potencial de utilizar mucha menos energía que los basados en la electrónica. Además, con la óptica se pueden tener anchos de banda o densidades de computación mucho mayores. La luz puede transferir mucha más información en un área mucho más pequeña.
Pero las redes neuronales ópticas (ONN) actuales enfrentan desafíos importantes. Por ejemplo, utilizan una gran cantidad de energía porque son ineficientes a la hora de convertir en luz los datos entrantes basados en energía eléctrica. Además, los componentes implicados son voluminosos y ocupan mucho espacio. Y si bien los ONN son bastante buenos en cálculos lineales como la suma, no son buenos en cálculos no lineales como la multiplicación.
Arquitectura basada en láseres
Los investigadores presentan una arquitectura compacta que resuelve todos estos desafíos y dos más simultáneamente. Esta arquitectura se basa en conjuntos de última generación de láseres emisores de superficie verticales (VCSEL), una tecnología relativamente nueva utilizada en aplicaciones que incluyen la detección remota LiDAR y la impresión láser.
El MIT considera que la técnica abre una vía para que los procesadores optoelectrónicos a gran escala aceleren las tareas de aprendizaje automático desde los centros de datos hasta los dispositivos de borde descentralizados. Asimismo, como los componentes del sistema pueden crearse utilizando procesos de fabricación que ya se utilizan hoy en día, esperan que el sistema pueda ampliarse para uso comercial en unos pocos años.