La tecnología de redes neuronales, un tipo de inteligencia artificial (IA), se encuentra en una amplia gama de aplicaciones, desde asistentes de voz como Alexa o Siri hasta vehículos autónomos y sistemas de recomendación personalizados. A medida que la tecnología de IA se integra más profundamente en las vidas de las personas, existe una creciente preocupación por su confiabilidad. El comité conjunto de la International Electrotechnical Commission (IEC) y la Organización Internacional de Normalización (ISO) está trabajando para desarrollar estándares que aborden la seguridad de esta tecnología.
Como resultado de este trabajo conjunto, se ha desarrollado la serie de estándares ISO/IEC 24029 sobre redes neuronales, que posee el mismo enfoque holístico basado en ecosistemas, aborda las preocupaciones éticas y los requisitos tecnológicos emergentes simultáneamente para permitir una adopción responsable.
La robustez es la capacidad de un sistema de IA para mantener su nivel de rendimiento en cualquier condición. El informe técnico (TR), ISO/IEC TR 24029-1, publicado en 2021, destaca tres tipos de métodos que se pueden utilizar para evaluar la robustez de las redes neuronales.
Primero, los métodos formales se basan en pruebas formales sólidas para comprobar si ciertas propiedades son demostrables en un dominio de uso específico. El segundo método se centra en los enfoques estadísticos, que implican pruebas matemáticas de conjuntos de datos para determinar un cierto nivel de confianza en los resultados. Ayudan a los evaluadores a responder preguntas relacionadas con los umbrales de desempeño, como tasas de falsos positivos/negativos, y si son aceptables.
Por último, los métodos empíricos implican experimentación, observación y juicio de expertos para evaluar el comportamiento del sistema en escenarios específicos. Los evaluadores pueden determinar el grado en que las propiedades del sistema son ciertas en situaciones de la vida real.
Medición de la robustez de las redes neuronales
La norma internacional recientemente publicada ISO/IEC 24029-2 se centra en métodos de evaluación formales para medir la robustez de las redes neuronales. El estándar ofrece una base teórica combinada con metodologías prácticas para garantizar que los sistemas de IA puedan resistir los desafíos del mundo real, incluso fuera de entornos controlados.
El nuevo estándar ISO/IEC proporciona directrices esenciales para evaluar la solidez de las redes neuronales bajo diferentes limitaciones y condiciones, proporcionando a los evaluadores un conjunto de requisitos, recomendaciones y técnicas específicas.