El equipo de la Great Bay University ha presentado PhysMamba, un innovador marco de IA para medir la frecuencia cardíaca y señales fisiológicas relacionadas a través de vídeos facialesEsta importante innovación en fotopletismografía remota (rPPG) proporciona un método sin contacto para el monitoreo de la salud, lo que abre nuevas oportunidades para aplicaciones médicas y de bienestar inmediatas.
PhysMamba se distingue de las metodologías rPPG anteriores que se basaban principalmente en redes neuronales convolucionales (CNN) y transformadores. Estos enfoques de medición tradicionales a menudo tenían dificultades para capturar con precisión las dependencias temporales esenciales de largo alcance que son cruciales para la medición de la frecuencia cardíaca, especialmente cuando se trata de secuencias de video más largas. PhysMamba resuelve estas barreras al introducir un bloque Mamba de Diferencia Temporal (TD-Mamba) de última generación junto con una arquitectura SlowFast de doble flujo. Al hacer esto, el modelo procesa de manera efectiva las características temporales de corto y largo plazo, lo que aumenta su precisión en la detección de señales fisiológicas precisas. Puede leer el artículo aquí.
A través de una serie de experimentos detallados en conjuntos de datos de referencia, incluidos PURE, UBFC-rPPG y MMPD, PhysMamba mostró avances impresionantes en comparación con los modelos actuales. Esto dio como resultado tasas de error reducidas y una mayor precisión en la estimación de la frecuencia cardíaca. Superando significativamente los modelos CNN y Transformer típicos, el marco innovador fue particularmente efectivo en situaciones del mundo real afectadas por variaciones de iluminación y movimientos faciales.
Esta nueva versión de un modelo de IA, adoptada por CCBR 2024, es un avance crucial en el monitoreo fisiológico no invasivo. El equipo de investigación ha publicado El código para PhysMamba en GitHub, lo que brinda oportunidades para investigación y desarrollo adicionales en este apasionante dominio de la visión por computadora y la tecnología de la salud.