Reconhecimento Precoce de Autismo: Análise da Fala e Transferência de Aprendizagem
A detecção precoce de Transtorno do Espectro Autista (TEA) é fundamental para o manejo e intervenção eficazes. Um número significativo de indivíduos com TEA recebe o diagnóstico tardiamente ou permanece sem diagnóstico, o que impacta negativamente o desenvolvimento e a qualidade de vida. A fala desempenha um papel crucial no TEA, já que muitos indivíduos afetados apresentam dificuldades na comunicação verbal ou são não-verbais.
Pesquisadores têm explorado o uso da análise da fala para o reconhecimento automático de TEA em crianças, classificando a fala como autista ou tipicamente desenvolvida. O projeto Noor, por exemplo, investiga métodos de transferência de aprendizagem para superar a escassez de grandes conjuntos de dados rotulados. A transferência de aprendizagem permite que modelos treinados em tarefas relacionadas ou em grandes conjuntos de dados não relacionados sejam adaptados para a identificação de TEA a partir da fala. Duas abordagens de ajuste fino foram estudadas: Discriminative Fine-Tuning (D-FT), pré-treinado em um conjunto de dados relacionado, e Wav2Vec 2.0 Fine-Tuning (W2V2-FT), que utiliza representações de fala auto-supervisionadas pré-treinadas em um conjunto de dados maior e não relacionado.
O estudo abordou duas tarefas de classificação distintas: uma tarefa binária para determinar a tipicidade, classificando a fala como a de uma criança com desenvolvimento típico (TD) ou atípico (AD), e uma tarefa de diagnóstico de quatro classes, que classifica ainda mais os casos atípicos em TEA, disfasia (DYS) ou transtorno invasivo do desenvolvimento sem outra especificação (NOS), juntamente com TD. Os resultados indicam que os métodos de transferência de aprendizagem podem ser valiosos para o reconhecimento de autismo a partir da fala. O modelo D-FT obteve o melhor desempenho na classificação de tipicidade (TD vs. AD), superando o W2V2-FT. Na tarefa de diagnóstico (TD, TEA, DYS, NOS), o D-FT também demonstrou desempenho superior. Estes resultados destacam o potencial da transferência de aprendizagem para o reconhecimento de TEA baseado na fala e sublinham os desafios da classificação multiclasse com dados rotulados limitados.
Origem: Link