Al incorporar capacidades de inteligencia artificial (IA), como las redes neuronales artificiales (RNA), a los dispositivos IoT de borde se requieren recursos computacionales sustanciales. Mientras tanto, los dispositivos IoT de borde son inherentemente pequeños, con potencia, velocidad de procesamiento y espacio de circuito limitados. Para unificar ambas tecnologías, los investigadores de la Universidad de Ciencias de Tokio han presentado un nuevo algoritmo de entrenamiento para un tipo especial de redes neuronales artificiales (RNA) llamado red neuronal binarizada (BNN), así como una implementación innovadora de este algoritmo en una arquitectura de computación en memoria (CiM) de vanguardia adecuada para dispositivos IoT.
El nuevo algoritmo de entrenamiento, denominado gradiente ternario BNN (TGBNN), presenta tres innovaciones clave. En primer lugar, emplea gradientes ternarios durante el entrenamiento, mientras mantiene los pesos y las activaciones binarias. En segundo lugar, mejoraron el estimador directo (STE), optimizando el control de la retropropagación del gradiente para garantizar un aprendizaje eficiente. En tercer lugar, adoptaron un enfoque probabilístico para actualizar los parámetros aprovechando el comportamiento de las celdas de memoria de acceso aleatorio magnetorresistiva (MRAM).
Posteriormente, el equipo de investigación implementó el algoritmo TGBNN en una arquitectura CiM, que realiza los cálculos directamente en la memoria, en lugar de en un procesador dedicado, para ahorrar espacio y energía en el circuito. Esto fue posible gracias al desarrollo de una puerta lógica XNOR completamente nueva como componente básico para una matriz de MRAM. Esta puerta utiliza una unión de túnel magnético para almacenar información en su estado de magnetización.
Para cambiar el valor almacenado de una celda MRAM individual, los investigadores aprovecharon dos mecanismos diferentes. El primero fue el par de giro-órbita, la fuerza que se produce cuando se inyecta una corriente de giro de un electrón en un material. El segundo fue la anisotropía magnética controlada por voltaje, que se refiere a la manipulación de la barrera de energía que existe entre los diferentes estados magnéticos de un material. Gracias a estos métodos, el tamaño del circuito de cálculo del producto de la suma se redujo a la mitad del de las unidades convencionales.
Realización de tareas complejas en las viviendas inteligentes
El equipo probó el rendimiento de su sistema CiM basado en MRAM propuesto para las BNN utilizando el conjunto de datos de escritura a mano MNIST, que contiene imágenes de dígitos escritos a mano individuales que las RNA deben reconocer. Los resultados mostraron que la BNN de gradiente ternarizado de la universidad logró una precisión de más del 88% utilizando el aprendizaje basado en códigos de salida de corrección de errores (ECOC), al tiempo que igualaba la precisión de las BNN regulares con la misma estructura y lograba una convergencia más rápida durante el entrenamiento.
Este avance podría allanar el camino para dispositivos IoT potentes capaces de aprovechar la IA en mayor medida. Esto tiene implicaciones notables para muchos campos en rápido desarrollo. Por ejemplo, las viviendas inteligentes podrían realizar tareas más complejas y operar de una manera más receptiva. El diseño propuesto también podría reducir el consumo de energía, contribuyendo así a los objetivos de sostenibilidad.