Un equipo de investigación del Instituto Nacional de Ciencia y Tecnología de Ulsan (Unist), en Corea del Sur, ha presentado un modelo de inteligencia artificial (IA) de aprendizaje federado, denominado Privacy-preserving improved stochastic aasking (Prism). Prism funciona como un modelo de IA que actúa como mediador, conectando la inteligencia artificial local con la IA global durante el proceso de aprendizaje federado. Este modelo reduce los costos de comunicación en un promedio del 38% en comparación con los modelos existentes, y su tamaño se reduce a un nivel de 1 bit, lo que le permite operar eficientemente en las CPU y la memoria de dispositivos pequeños, como teléfonos inteligentes y tablets, garantizando la protección de los datos confidenciales.

El aprendizaje federado es una técnica que permite la creación de una IA global mediante la compilación de resultados de la inteligencia artificial local de cada dispositivo después de realizar el aprendizaje sin necesidad de cargar información confidencial directamente al servidor.
Prism evalúa con precisión qué información de IA local confiar e incorporar, incluso en situaciones donde hay una variabilidad significativa en los datos y el rendimiento entre diferentes IA locales, lo que genera resultados de alta calidad.
Por ejemplo, al transformar un selfie en una imagen al estilo Studio Ghibli, los métodos anteriores requerían subir la foto a un servidor, lo que generaba preocupación por posibles violaciones de la privacidad. Con Prism, todo el procesamiento se realiza en el smartphone, lo que protege la privacidad personal y permite obtener resultados rápidamente. Sin embargo, es importante destacar que el desarrollo del modelo de IA local capaz de generar imágenes en el smartphone es un requisito aparte.
Imágenes de mayor calidad
Los resultados experimentales con conjuntos de datos comúnmente utilizados para validar el rendimiento de la inteligencia artificial, como Mnist, Fmnist, CelebA y Cifar10, demostraron que Prism no solo redujo el volumen de comunicación, sino que también generó imágenes de mayor calidad en comparación con los métodos tradicionales. Cabe destacar que experimentos adicionales con el conjunto de datos Mnist confirmaron la compatibilidad con los modelos de difusión utilizados principalmente para generar imágenes al estilo Studio Ghibli.
El equipo de investigación mejoró la eficiencia de la comunicación mediante un método de máscara binaria estocástica que comparte selectivamente solo información crítica en lugar de compartir una gran cantidad de parámetros. Además, el uso de la discrepancia máxima media (MMD) para la evaluación precisa de la calidad generativa y las estrategias de agregación dinámica con conciencia de máscara (MADA), que agregan las contribuciones de cada IA local de forma diferente, ayudaron a mitigar las discrepancias de datos y la inestabilidad del entrenamiento.
Este enfoque se puede aplicar no solo a la generación de imágenes, sino también a la generación de texto, la simulación de datos y la documentación automatizada, lo que lo convierte en una solución eficaz y segura en campos que manejan información sensible, como la salud y las finanzas.