El Instituto Tecnológico de Massachussets (MIT) ha desarrollado un nuevo método que acelera los cálculos de aprendizaje automático de los altavoces inteligentes y otros dispositivos conectados de bajo consumo. Este método permite reducir la latencia y ofrecer un servicio mucho más rápido a los usuarios.
Una de las razones por las que ocurre la latencia es porque los dispositivos conectados no tienen suficiente memoria o energía para almacenar y ejecutar los enormes modelos de aprendizaje automático necesarios para que el dispositivo comprenda lo que el usuario le pide. El modelo se almacena en un centro de datos que puede estar a cientos de kilómetros de distancia, donde se calcula la respuesta y se envía al dispositivo.
Con el nuevo método del MIT, su técnica cambia los pasos intensivos en memoria de ejecutar un modelo de aprendizaje automático a un servidor central donde los componentes del modelo se codifican en ondas de luz.
Las ondas se transmiten a un dispositivo conectado mediante fibra óptica, lo que permite enviar toneladas de datos a grandes velocidades a través de una red. Por su parte, el receptor emplea un dispositivo óptico simple que realiza los cálculos rápidamente utilizando las partes de un modelo transportado por esas ondas de luz.
Según los investigadores, esta técnica mejorará en más de 100 veces la eficiencia energética en comparación con otros métodos, al tiempo que podría mejorar la seguridad, ya que no es necesario transferir los datos de un usuario a una ubicación central para su cómputo.
Este método podría permitir a un usuario tener una conversación sin latencia con su dispositivo doméstico inteligente o ser utilizado para el procesamiento de vídeo en vivo a través de redes celulares, entre otras aplicaciones.
Nuevo método para el cálculo del aprendizaje automático
La arquitectura de red neuronal consiste en almacenar la carga en un servidor central que está conectado a una nueva pieza de hardware llamada transceptor inteligente. Este transceptor inteligente utiliza tecnología conocida como fotónica de silicio para recuperar billones de cargas de la memoria cada segundo.
Recibe las cargas como señales eléctricas y las imprime en ondas de luz. Dado que los datos de peso están codificados como bits (1 y 0), el transceptor los convierte cambiando los láseres. Combina estas ondas de luz y luego las transfiere periódicamente a través de una red de fibra óptica para que un dispositivo cliente no necesite consultar al servidor para recibirlas.
Una vez que las ondas de luz llegan al dispositivo del cliente, un componente óptico simple conocido como modulador de banda ancha ‘Mach-Zehnder’ las usa para realizar cálculos analógicos súper rápidos. Esto implica codificar los datos de entrada del dispositivo, como la información del sensor, en las cargas. Posteriormente, envía cada longitud de onda individual a un receptor que detecta la luz y mide el resultado del cálculo.
Los investigadores crearon una forma de usar este modulador para hacer trillones de multiplicaciones por segundo, lo que aumenta enormemente la velocidad de cálculo en el dispositivo mientras usa solo una pequeña cantidad de energía.