Los investigadores del Instituto Avanzado de Ciencia y Tecnología de Corea (KAIST) han desarrollado una tecnología que permite al aprendizaje continuo de inteligencia artificial adaptarse a los diversos cambios de datos, al tiempo que aprende nuevos conocimientos sin olvidar los conocimientos existentes.
Recientemente, los métodos basados en indicaciones se han vuelto populares en el aprendizaje continuo para reducir los costos de capacitación. El conocimiento especializado para cada tarea se almacena en indicaciones y el conocimiento pasado se utiliza eficazmente agregando indicaciones apropiadas a los datos de entrada y transmitiéndolos a la red neuronal profunda.
A diferencia de los enfoques existentes, la nueva tecnología de aprendizaje continuo basada en indicaciones adaptativas puede adaptarse a diversos grados de cambio entre tareas. Si la tarea que está aprendiendo actualmente es similar a una tarea aprendida anteriormente, se acumula el conocimiento adicional en la instrucción asignada a esa tarea sin crear una nueva instrucción.
En otras palabras, se creó un nuevo mensaje para hacerse cargo solo cuando se ingresaba una tarea completamente nueva, y el equipo de investigación verificó si la agrupación era apropiada cada vez que se ingresaba una nueva tarea para mantener el estado de agrupación óptimo.
Validación de la metodología
El equipo de investigación validó la metodología utilizando datos del mundo real con distintos grados de variación entre tareas para problemas de clasificación de imágenes. Como resultado, en comparación con la metodología de aprendizaje continuo basada en indicaciones existente, el equipo de investigación logró una mejora de la precisión de hasta un 14% en un entorno donde el grado de cambio entre tareas siempre es grande, y una mejora de la precisión de hasta un 8% en un entorno donde el cambio entre tareas puede ser grande o pequeño.
Además, se confirmó que el número de grupos mantenidos por el método propuesto es casi igual al número de grupos de tareas similares reales. El coste de realizar una agrupación en clústeres online es muy pequeño, por lo que se puede aplicar fácilmente a grandes cantidades de datos.