INFORMATION | DareVoz |
Title: DareVoz - Principal Investigator: Juan Ignacio Godino Start Date: 2007 Duration: 4 Participants: , Convocatory: |
Objectives: Complementar la base de datos de voces patológicas: para abordar la detección automática de las patologías de fonación esnecesario disponer de grabaciones de voces de pacientes, incluyendo las de sujetos de control con voz normal. Desgraciadamente,al contrario que en otros campos de la tecnología de voz -como la verificación o reconocimiento de locutor, y reconocimiento dehabla-, en el campo de la patología y calidad de la voz no existen tales corpus o bases de datos disponibles para la comunidad científica. Además, se hace necesario experimentar con bases de datos de hablantes del mismo idioma, dado que se aprecian diferencias interlingua incluso en la fonación sostenida de una misma vocal. Complementar la base de datos ha de servir para el entrenamiento y prueba sistemática sobre habla hispana de los algoritmos desarrollados. La base de datos de voces patológicas, además de un medio para conseguir nuestros objetivos, es por sí misma, unproducto de gran valía, tanto para fines tanto docentes como investigadores. Validación de resultados previos en la tarea de evaluación objetiva de la calidad de la voz: en la actualidad se dispone de algoritmos para la evaluación objetiva de la calidad de la voz acorde a criterios perceptuales. Se pretende validar los algoritmos y métodos propuestos actualmente con un conjunto de ficheros de prueba que permitan extraer conclusiones más significativas. Validación de la herramienta de síntesis de imágenes quimográficas con vídeo de alta velocidad: en la actualidad, nuestro grupo ha desarrollado herramientas para la síntesis de imágenes quimográficas, pero únicamente han podido ser validadas haciendo uso de vídeos tomados con técnicas convencionales de baja velocidad e iluminación estroboscópica. Se ha demostrado su eficacia complementaria en el diagnóstico; no obstante se pretende contrastar y comparar su utilidad diagnóstica comparándolo con imágenes tomadas con cámaras de alta velocidad. Nuevas estrategias de detección de presencia de patología a partir de registros de habla continua: a pesar de la alta eficiencia alcanzada por el sistema actualmente desarrollado para la detección automática de patología, esta tarea no se puede considerar cerrada. Se pretende mejorar la eficiencia haciendo uso de nuevos conjuntos de parámetros basados en los modelos biomecánicos de las cuerdas vocales que han sido desarrollados con anterioridad por nuestro grupo de trabajo. Asimismo, se pretende abordar una tarea que prácticamente está inédita: la detección automática de patología de voz utilizando registros de habla continua. Desarrollo de algoritmos para la extracción de nuevos parámetros: se pretende estudiar nuevos esquemas de parametrización a corto plazo complementándolos con algún tipo de medida de la variabilidad temporal. El uso de descomposiciones subbanda (wavelet packets) combinado con medidas de entropía de la señal se antoja muy adecuado al problema en estudio, ya que las voces patológicas se caracterizan por un claro aumento de las perturbaciones en frecuencia, amplitud y ruido que derivan en unamayor variabilidad de la onda acústica. Incorporación de facilidades de diagnóstico remoto: en el contexto del diagnóstico de las patologías de voz se hace necesaria la posibilidad de envío y/o almacenamiento remoto de registros de audio, electroglotograma y videoendoscopia para su evaluaciónpor especialistas médicos o con objeto de facilitar el trabajo colaborativo entre especialistas, mejorando así la calidad y agilidad del proceso asistencial. Se pretende desarrollar, evaluar y validar una plataforma de diagnóstico remoto de problemas de fonación en el contexto del proceso asistencial del tratamiento de las patologías de la voz. Desarrollo de una herramienta de rehabilitación de la voz: es habitual que el proceso asistencial en patología de voz, finalice con un tratamiento rehabilitador dirigido por foniatras y/o logopedas. Se pretende complementar el paquete software existente con herramientas basadas en ordenador personal que sirvan para abordar las tareas de rehabilitación de la voz. Se puede decir que al incorporar este tipo de herramientas dentro del paquete software existente se cerraría el ciclo completo del diagnóstico y tratamiento, por lo que se dispondría de una verdadera “herramienta integrada” para el diagnóstico y tratamiento de las patologías de la voz. Integrar este tipo de herramientas dentro del sistema, reportaría la oportuna retroalimentación a los distintos agentes presentes en el proceso asistencial. Elaboración de un modelo paramétrico de las cuerdas vocales basado en el tratamiento digital de la imagen: se trata de definir un conjunto de parámetros objetivos para la caracterización de las cuerdas vocales de cara a la detección de algunas patologías laríngeas. Para ello, se pretende medir las características longitudinales, angulares y de contorno para establecer unos patrones que diferencien algunas patologías relevantes para los especialistas en Otorrinolaringología. Una vez definido el modelo de caracterización, se diseñará un algoritmo que permita hacer un diagnóstico automatizado en base al modelo propuesto a partirde unos parámetros objetivos. Se aplicarán técnicas de procesado digital de imagen como filtros de Kalman para el preprocesadode la imagen y operadores de Prewitt, Canny y spline-snakes para la generación de contornos sobre los cuales definir la parametrización y que servirán, por tanto, para avanzar algunas características acerca del diagnóstico.