Los modelos de redes neuronales profundas que impulsan las aplicaciones de aprendizaje automático se han vuelto tan grandes y complejos que están superando los límites del hardware informático electrónico tradicional. En este contexto, los científicos del Instituto Tecnológico de Massachussets (MIT) han desarrollado un nuevo chip fotónico capaz de realizar todos los cálculos clave de una red neuronal profunda de forma óptica en el chip, lo que podría permitir un aprendizaje profundo más rápido y con mayor eficiencia energética para aplicaciones computacionalmente exigentes, como LiDAR o telecomunicaciones de alta velocidad.
Las redes neuronales profundas se componen de muchas capas interconectadas de nodos, o neuronas, que operan sobre datos de entrada para producir un resultado. Una operación clave en una red neuronal profunda implica el uso de álgebra lineal para realizar la multiplicación de matrices, que transforma los datos a medida que pasan de una capa a otra. Además de estas operaciones lineales, las redes neuronales profundas realizan operaciones no lineales que ayudan al modelo a aprender patrones más complejos.
En 2017, un proyecto anterior demostró una red neuronal óptica en un solo chip fotónico que podía realizar la multiplicación de matrices con luz. Pero en ese momento, el dispositivo no podía realizar operaciones no lineales en el chip. Los datos ópticos debían convertirse en señales eléctricas y enviarse a un procesador digital para realizar operaciones no lineales.
Unidades de función óptica no lineal (NOFU)
En base a esta investigación, los investigadores del MIT han diseñado unos dispositivos llamados unidades de función óptica no lineal (NOFU), que combinan electrónica y óptica para implementar operaciones no lineales en el chip. Compuesto de módulos interconectados que forman una red neuronal óptica, el chip se fabrica mediante procesos de fundición comerciales, lo que podría permitir el escalado de la tecnología y su integración en la electrónica.
Los investigadores construyeron una red neuronal profunda óptica en un chip fotónico utilizando tres capas de dispositivos que realizan operaciones lineales y no lineales. En primer lugar, su sistema codifica los parámetros de una red neuronal profunda en luz. Posteriormente, una serie de divisores de haz programables realiza la multiplicación de matrices sobre esas entradas.
Los datos pasan a NOFU programables, que implementan funciones no lineales al desviar una pequeña cantidad de luz hacia fotodiodos que convierten las señales ópticas en corriente eléctrica. Este proceso, que elimina la necesidad de un amplificador externo, consume muy poca energía.
Mayor precisión de cálculo y menor consumo de energía
Al obtener una latencia tan baja, permitió entrenar de manera eficiente una red neuronal profunda en el chip, un proceso conocido como entrenamiento in situ, que normalmente consume una enorme cantidad de energía en hardware digital.
El sistema fotónico logró una precisión de más del 96% durante las pruebas de entrenamiento y más del 92% durante la inferencia, lo que es comparable al hardware tradicional. Además, el chip realiza cálculos clave en menos de medio nanosegundo.
Todo el circuito se fabricó utilizando la misma infraestructura y los mismos procesos de fundición que se utilizan para producir chips informáticos CMOS. Esto podría permitir que el chip se fabricara a gran escala, utilizando técnicas probadas que introducen muy pocos errores en el proceso de fabricación.
Los investigadores tienen el objetivo principal de ampliar el tamaño de su dispositivo e integrarlo con dispositivos electrónicos del mundo real, como cámaras o sistemas de telecomunicaciones. Además, los investigadores quieren explorar algoritmos que puedan aprovechar las ventajas de la óptica para entrenar sistemas más rápido y con una mejor eficiencia energética.