La toma de decisiones basada en datos impulsada por algoritmos de machine learning (ML) está cambiando la forma en que funcionan la sociedad y la economía. Para que estas soluciones sean efectivas, los datos a menudo deben procesarse cerca del usuario final y dichos datos pueden ser privados y confidenciales. En este contexto, IMDEA Networks trabajará en desarrollar redes y soluciones eficientes en la nube y el aprendizaje federado a través de la iniciativa MLEDGE (Cloud and Edge Machine Learning).
El aprendizaje distribuido y el federado (FL) emergen como un paradigma dentro de la rama ML. El aprendizaje federado ha crecido en paralelo con la expansión de la nube hacia el borde (cloud edge), pero los dos se han desarrollado en su mayoría de forma independiente, a pesar de su paralelismo natural.
A través de MLEDGE, los investigadores implementarán un aprendizaje federado como una capa intersectorial independiente, pero optimizada sobre cloud edge, con aplicaciones y datos del mundo real para demostrar que esta sinergia puede generar grandes beneficios para todos.
Según los investigadores, el proyecto aporta investigación en aprendizaje federado como servicio (FLaaS), procesamiento cloud edge, uso eficiente del aprendizaje federado en nubes híbridas y protección contra ataques, protección de intercambio de datos sensibles o confidenciales y gestión de desafíos de portabilidad de datos en el perímetro, entre otras áreas.
Soluciones para la protección de datos
El equipo diseñará un marco de desarrollo y componentes que ayuden a popularizar este tipo de servicios, así como soluciones contra ataques de envenenamiento o inferencia lanzados desde servidores perimetrales rebeldes y/o nodos de agregación. Asimismo, se incluye la creación de una marca de agua para proteger contra la redistribución de datos o metadatos intercambiados entre servidores en el borde bajo FLaaS.
Otros aspectos destacados serán crear una capa de lógica comercial y económica, que implemente una distribución justa de costos e ingresos entre las partes al colaborar en la capacitación del modelo ML; respaldar las operaciones DevOps para acelerar el ciclo de vida del desarrollo de software; y proporcionar una entrega continua de alta calidad y el desarrollo continuo de servicios de aprendizaje automático en la nube, optimizando los costos mediante la monitorización, la predicción y la asignación inteligente y eficiente de energía de los trabajos computacionales.
En un contexto internacional, la innovación del proyecto desarrollará condiciones de mercado favorables para el uso del aprendizaje federado en la nube y en arquitecturas de datos federados, como, por ejemplo, las definidas por instituciones como IDSA o Gaia-X, con innovaciones de gran interés para abordar importantes problemas económicos, empresariales y sociales vinculados a la existencia de silos en el almacenamiento y explotación de datos en la economía.