Para el procesamiento de imágenes en los sistemas de borde e IoT basados en inteligencia artificial (IA) de visión, como máquinas de autopago, cámaras de seguridad, sistemas de videoconferencia y aparatos inteligentes como dispositivos robóticos de limpieza, las compañías Renesas Electronics Corporation y Syntiant Corp han desarrollado una solución de IA multimodal controlada por voz que permite la operación sin contacto de bajo consumo.
La nueva solución se compone de una unidad de microprocesador (MPU) de inteligencia artificial de visión y un multimodal de baja potencia, así como un procesador de decisión neuronal para proporcionar las capacidades de voz y de procesamiento de imágenes avanzadas.
La solución conjunta presenta una funcionalidad siempre activa con una activación rápida por voz desde el modo de espera para realizar el reconocimiento de objetos, el reconocimiento facial y otras tareas basadas en la visión, que son funciones críticas en las cámaras de seguridad y otros sistemas.
De esta forma, mientras que las señales de voz definidas por el usuario impulsan la activación y el funcionamiento del sistema, el reconocimiento de IA de visión rastrea el comportamiento del operador, controla el funcionamiento y emite una advertencia cuando se detectan acciones sospechosas.
La arquitectura multimodal facilita la creación de experiencias del usuario sin contacto para sistemas basados en IA de visión. Gracias al procesador de decisión neuronal con capacidades de IA, se pueden implementar muchas funciones de voz manos libres de alta precisión, incluido el reconocimiento de oradores, la detección de palabras clave, varias palabras de activación y el reconocimiento de comandos locales.
Ahorro de energía
Para obtener una eficiencia energética en esta solución, se ha incorporado un acelerador DRP-AI (Procesador-IA dinámicamente reconfigurable), que combina la inferencia de la inteligencia artificial de alta precisión con una mayor eficiencia energética.
Este rendimiento energético superior elimina la necesidad de medidas de dispersión de calor como disipadores de calor o ventiladores de refrigeración, reduciendo el costo de la lista de materiales (BOM), al tiempo que facilita la integración de la IA de visión en una amplia gama de aplicaciones integradas.
Asimismo, el procesador de decisión neuronal está empaquetado con un motor de inferencia de red neuronal, permitiendo la ejecución de múltiples aplicaciones simultáneamente mientras minimiza el consumo de energía a 1 MW de energía de la batería.