La UCLM desarrolla un análisis de las propiedades de imágenes para evitar engañar a la IA

IA.

La inteligencia artificial (IA) que utilizan algunas funciones de los dispositivos inteligentes, como el reconocimiento facial, e incluso, la publicidad personalizada que aparece en Internet, entre otros sistemas, es posible manipularla con fines maliciosos. El grupo de investigación VISILAB de la Universidad de Castilla-La Mancha (UCLM) ha publicado, en la revista Chaos, Solitons and Fractals, un estudio que analiza cómo detectar estos ataques, mediante el análisis de las propiedades de las imágenes cuando son procesadas por una red neuronal, desde el punto de vista de la teoría del caos.

El análisis de las propiedades de las imágenes identifica las alteraciones en los píxeles puntuales de una imagen que será procesada por una red neuronal.

Cuando se depende de una máquina para controlar un sistema de vigilancia o dirigir un vehículo autónomo, se desea que el entorno sea lo más seguro posible. Sin embargo, en estos casos, se abre la posibilidad de que un ataque malintencionado altere la entrada del sistema con pequeñas perturbaciones inocuas al ojo humano, pero cambiando el comportamiento del sistema de forma sustancial.

Este fenómeno es conocido como ejemplos adversarios. Se trata de imágenes a las que se les han modificado algunos píxeles, de forma que la inteligencia artificial no es capaz de funcionar con normalidad.

Análisis de las propiedades de las imágenes

La intuición detrás de este trabajo es que las alteraciones en píxeles puntuales de una imagen pueden suponer puntos caóticos en el sistema de la red neuronal. Frente a otros trabajos, no solo se analizan las imágenes de entrada, sino cómo afectan al modelo de inteligencia artificial en sus componentes internos, mientras están siendo procesadas, lo cual aporta una información mucho más rica a la hora de determinar si se trata de una imagen alterada por un atacante o, por el contrario, no ha sido modificada.

Esta técnica ha sido validada en una serie de conjuntos de datos con muestras de distintos tipos, desde dígitos numéricos (útiles para la digitalización de texto escrito) hasta fotografías de objetos del mundo real.

Con la técnica propuesta, se consiguen tasas de detección del 60% en los escenarios más complejos, alcanzando valores cercanos al 100% en la mayoría de las pruebas realizadas. Por tanto, se puede afirmar que el método desarrollado tiene aplicación en una gran variedad de casos de uso, con imágenes de diversa naturaleza y frente a distintos tipos de ataques.

 
 
Patrocinio Oro
Patrocinio Plata
Patrocinio Bronce
Salir de la versión móvil