ECA-SIMM

Taller de etiquetado manual de locuciones de habla para IA

Ficha de la actividad

Tipo de actividad: Cultural 

  • Carácter: Anual 
  • Nº de créditos propuestos:
  • Nº de horas: 50 

Breve descripción de la actividad

Se ofrece a los estudiantes formación eminentemente práctica para que puedan llevar a cabo tareas de etiquetado manual de voz para IA en el contexto de un proyecto de investigación del plan nacional. El taller incluye formación inicial en reuniones de armonización y certificado de participación. 

La mayor parte de los sistemas de Inteligencia Artificial (IA) necesitan disponer de datos de entrenamiento adecuadamente etiquetados. El etiquetado manual de datos de entrenamiento de calidad para este tipo de sistemas se está conv La mayor parte de los sistemas de Inteligencia Artificial (IA) necesitan disponer de datos de entrenamiento adecuadamente etiquetados. El etiquetado manual de datos de entrenamiento de calidad para este tipo de sistemas se está convirtiendo en una actividad imprescindible y es necesario disponer de personas formadas que puedan llevar a cabo el etiquetado con un buen nivel de calidad. En esta actividad, se ofrece a los estudiantes formación eminentemente práctica para que puedan llevar a cabo este tipo de tareas en el contexto de un proyecto de investigación en marcha. Disponemos de un videojuego serio para la práctica de la comunicación oral de personas con síndrome de Down, que ha permitido recopilar una base de datos de habla con un gran número de locuciones. En esta actividad los alumnos aprenderán, mediante un enfoque eminentemente activo, a anotar las locuciones, empleando una rúbrica de evaluación. Al principio del proceso de evaluación se realizarán sesiones de formación de los evaluadores en las que se presentará la rúbrica y se explicará cómo realizar la evaluación. A continuación, los estudiantes que participen en la anotación escucharán los ficheros de audio, marcarán los errores de pronunciación cometidos por el locutor y realizarán una valoración de la calidad de la pronunciación que incluirá aspectos sobre la fonética, la fluidez y la prosodia. Por último, se realizarán reuniones de armonización de los criterios de evaluación en las que se revisarán las evaluaciones realizadas por los alumnos para que éstas se ajusten a la rúbrica de evaluación, con el objetivo de conseguir un alto grado de acuerdo entre todos los etiquetadores (inter-rater reliability). La actividad se desarrollará en el marco del proyecto de investigación «Evaluación automática de la pronunciación de personas con síndrome de Down en un videojuego educativo» financiado por el Ministerio de Ciencia e Innovación (PID2021-126315OB-I00). Los alumnos participantes recibirán un certificado de colaboración en el proyecto de investigación. irtiendo en una actividad imprescindible y es necesario disponer de personas formadas que puedan llevar a cabo el etiquetado con un buen nivel de calidad.  

 En esta actividad, se ofrece a los estudiantes formación eminentemente práctica para que puedan llevar a cabo este tipo de tareas en el contexto de un proyecto de investigación en marcha. Disponemos de un videojuego serio para la práctica de la comunicación oral de personas con síndrome de Down, que ha permitido recopilar una base de datos de habla con un gran número de locuciones. En esta actividad los alumnos aprenderán, mediante un enfoque eminentemente activo, a anotar las locuciones, empleando una rúbrica de evaluación. Al principio del proceso de evaluación se realizarán sesiones de formación de los evaluadores en las que se presentará la rúbrica y se explicará cómo realizar la evaluación. A continuación, los estudiantes que participen en la anotación escucharán los ficheros de audio, marcarán los errores de pronunciación cometidos por el locutor y realizarán una valoración de la calidad de la pronunciación que incluirá aspectos sobre la fonética, la fluidez y la prosodia. Por último, se realizarán reuniones de armonización de los criterios de evaluación en las que se revisarán las evaluaciones realizadas por los alumnos para que éstas se ajusten a la rúbrica de evaluación, con el objetivo de conseguir un alto grado de acuerdo entre todos los etiquetadores (inter-rater reliability).  

 La actividad se desarrollará en el marco del proyecto de investigación «Evaluación automática de la pronunciación de personas con síndrome de Down en un videojuego educativo» financiado por el Ministerio de Ciencia e Innovación (PID2021-126315OB-I00). En el marco de este proyecto se ha desarrollado ya una rúbrica validada inicialmente por expertos, que se usará para llevar a cabo el taller. Los alumnos participantes recibirán un certificado de colaboración en el proyecto de investigación. 

Objetivos

Aprender los aspectos básicos de fonética, prosodia y fundamentos del etiquetado perceptual de locuciones de voz para el entrenamiento de sistemas IA. Ser capaz de etiquetar un corpus de habla manteniendo la consistencia de las evaluaciones. Colaborar en un proyecto de clara orientación social. 

  • Los alumnos aprenderán los fundamentos del etiquetado manual de locuciones de voz siguiendo una aproximación perceptual, para el entrenamiento de sistemas IA. 
  • Los alumnos se formarán en aspectos básicos de fonética, fluidez y prosodia. 
  • Los alumnos serán capaces de etiquetar un corpus de habla manteniendo la consistencia de las evaluaciones (requiere trabajo en equipo y coordinación entre los participantes). 

Mecanismos de evaluación y seguimiento

Se evaluará el nivel y la participación en las sesiones de formación y armonización. El trabajo se realiza a través de una página web con acceso personal protegido, que facilita el registro de las tareas realizadas por cada participante, así como la valoración del tiempo invertido. 

Para realizar el etiquetado de las locuciones se empleará una página web en la que los alumnos accederán empleando usuario y contraseña. Esta página web llevará registro de todo el trabajo que desarrollen los alumnos. En concreto, se registra el tiempo que emplean en la evaluación de las distintas locuciones. Esto nos permitirá realizar el seguimiento de la actividad. 

En las sesiones de armonización se computarán las discrepancias de cada participante con respecto a la mayoría. Esto nos permitirá realizar la evaluación de la calidad de la anotación que está llevando a cabo cada alumno. 

Requisito mínimo de presencialidad

La presencialidad es obligatoria para las 10 horas de reuniones de formación y para las reuniones de armonización (80% del total). El resto se realizará a través de la web de evaluación, guardando registro de actividad.  

Parte del trabajo se podrá hacer de forma no presencial empleando la página web de evaluación, que deja registro de las horas dedicadas a la actividad. 

La presencialidad es obligatoria para las reuniones de formación y para las reuniones de armonización. 

Para la concesión de créditos será necesario dedicar 50 horas a la actividad, de las cuales 6 horas corresponden a las reuniones presenciales. El plan de trabajo personal de cada estudiante será flexible, aunque se espera una dedicación promedio de 10 horas semanales durante cinco semanas. 

Todos los recursos necesarios para realizar las tareas del taller serán puestos a disposición de los estudiantes por el Grupo de Investigación, que dispone de servidores y puestos de trabajo en laboratorio de investigación en caso de que el estudiante prefiera trabajar en dicho laboratorio en lugar de hacerlo de forma remota.