Como a IA separa os sons concorrentes nos aparelhos auditivos

 


As novas técnicas de aprendizagem profunda ajudam os utilizadores de implantes cocleares e de aparelhos auditivos convencionais a distinguir os sons ambientais do ruído de fundo.

Qualquer pessoa com perda auditiva conhece o desafio: a buzina de um carro toca enquanto tenta ouvir uma conversa; a cozinha ferve enquanto ouve um podcast; os sons da natureza misturam-se com o zumbido doméstico. As pessoas com audição normal conseguem-no através de uma espécie de classificação neural, isolando rapidamente o som que querem focar. Mas para os utilizadores de aparelhos auditivos, sejam aparelhos convencionais ou implantes cocleares, este “problema do cocktail” continua a ser uma das lacunas mais frustrantes entre a tecnologia e a audição no mundo real.

Investigadores da Universidade do Texas em Dallas decidiram testar se a inteligência artificial poderia melhorar a forma como os aparelhos auditivos lidam com os sons ambientais concorrentes. O foco deles não era a fala; foi a rica camada de eventos acústicos que compõem a vida diária - farfalhar de folhas, latidos de cães, água corrente, portas a bater.

Sobre este estudo

 

Title: Separação de fontes ambientais e melhoramento do som com base na aprendizagem profunda: Avanços para implantes cocleares e ouvintes com audição normal

Authors: Ram CMC Shekar, John H L Hansen

 

Affiliations:0 Center for Robust Speech Systems - Laboratório de Processamento de Implantes Cocleares, Universidade do Texas em Dallas

Journal:0 O Jornal da Sociedade Acústica da América - Abril de 2026

 

Tipo de estudo:0 Estudo experimental com avaliações de ouvintes humanos

Source: PubMed- DOI: 10.1121/10.0042760

Antecedentes: Por que razão os investigadores analisaram este

Os utilizadores de implantes cocleares enfrentam desafios específicos com a perceção sonora ambiental. Embora a moderna tecnologia de CI seja excelente na transmissão de sinais de voz, as assinaturas acústicas mais difusas e variáveis ​​dos eventos ambientais – cantos dos pássaros, chuva, trânsito – continuam a ser mais difíceis de processar. Esta limitação afeta a segurança (dificuldade em ouvir os veículos que se aproximam), a qualidade de vida (menos prazer com os sons naturais) e a autonomia geral.

O desafio da engenharia é real: quando múltiplas fontes sonoras se sobrepõem, separá-las requer sofisticação computacional. O processamento de áudio tradicional tem feito progressos incrementais, mas a aprendizagem profunda oferece um novo caminho. Ao treinar redes neuronais em grandes bibliotecas de sons rotulados e as suas misturas, os investigadores podem ensinar algoritmos para isolar fontes específicas, mesmo em cenas complexas e ruidosas.

Como o estudo foi feito

Shekar e Hansen desenvolveram uma estrutura experimental que imitava cenários de audição do mundo real. Criaram misturas sonoras de duas fontes combinando um som “alvo” (como chuva ou pássaros) com um som de “interferência” concorrente. Tanto os utilizadores de IC como as pessoas com audição normal ouviram três versões de cada mistura: o áudio misturado em bruto como linha de base, o áudio processado utilizando apenas a separação da fonte e o áudio que combinava a separação da fonte com a técnica de melhoramento dos próprios investigadores para sons não linguísticos.

O algoritmo de separação de origem utilizou uma arquitetura de aprendizagem profunda denominada SUDORMEND (Successive Downsampling and Resampling of Multi-Resolution Features network). Os ouvintes avaliaram o áudio processado em três dimensões: redução de interferências, qualidade de áudio e distorção. Realizaram também testes de preferência de escolha forçada, indicando qual a versão que preferiam.

O que os investigadores descobriram

Os resultados diferiram significativamente entre os dois grupos de ouvintes. Os utilizadores de implante coclear apresentaram uma melhoria estatisticamente significativa na redução da interferência, mas apenas para os sons da natureza quando combinados com a interferência de categoria correspondente (F=4,935, p=0,0175). Isto sugere que o processamento do CI pode ser fortemente ajustado à fala, deixando o manuseamento mais amplo do som ambiental menos refinado.

Os ouvintes com audição normal apresentaram ganhos muito mais abrangentes. Demonstraram uma redução da interferência em todas as categorias de sons não linguísticos testadas, com valores estatísticos altamente significativos (valores de F que variam entre 8,481 e 32,37, valores de p muito abaixo de 0,001). Ambos os grupos - implante coclear e audição normal - manifestaram uma forte preferência pela abordagem combinada de separação de fontes e aperfeiçoamento ao ouvir sons da natureza e ruídos domésticos, como água a correr ou pratos a bater.

O contraste é revelador: quando se dá liberdade ao algoritmo para melhorar a perceção sonora não linguística para além do processamento focado na fala, os utilizadores percebem e preferem o resultado. O facto de os ouvintes com audição normal terem obtido melhorias mais amplas sugere que os aparelhos auditivos poderiam beneficiar substancialmente de algoritmos otimizados para paisagens sonoras ambientais, e não apenas para conversas.

O que significa para as pessoas com perda auditiva

Este trabalho expande o que os dispositivos auditivos podem fazer. Hoje em dia, a maioria dos aparelhos auditivos convencionais e dos implantes cocleares dão prioridade à inteligibilidade da fala – e com razão, uma vez que a conversação é fundamental na vida diária. Mas os humanos não vivem em mundos só de fala. A riqueza da experiência acústica inclui música, risos, natureza, sons de alarme e sinais áudio subtis que nos ajudam a navegar e a desfrutar do ambiente.

A investigação demonstra que a aprendizagem profunda pode destrinçar fontes ambientais sobrepostas e aumentar a sua clareza percetiva. Mais importante ainda, mostra que os ouvintes com perda auditiva preferem ativamente estas melhorias. Especialmente para os utilizadores de implantes cocleares, que podem ter maior dificuldade com os sons ambientais do que apenas com a fala, este tipo de processamento pode aumentar significativamente a independência e a qualidade de vida.

Avanços na separação do som na tecnologia auditiva moderna

A descoberta do estudo sobre a separação da fonte sonora é exatamente o tipo de fronteira tecnológica que as categorias de aparelhos auditivos de venda livre e direta ao consumidor aprovadas pela FDA tornaram possível. As empresas têm agora espaço para implementar o processamento de áudio avançado em aparelhos auditivos sem o modelo tradicional apenas clínico. Os algoritmos de aprendizagem profunda para tratamento de som ambiental enquadram-se naturalmente nesta evolução.

Dispositivos como o Panda Quantum integram testes auditivos clinicamente validados com redução adaptativa de ruído e conectividade Bluetooth para telefone e música. Adicionar separação de fontes aprendida - treinada em paisagens sonoras ambientais reais - representa a próxima camada de capacidade. O algoritmo faz o árduo trabalho computacional de isolar quais as fontes importantes, deixando o utilizador do aparelho auditivo livre para se concentrar no que quer ouvir.

Para a perda auditiva ligeira a moderada, os modelos de venda livre podem agora incluir estes tipos de processamento avançado. A perda auditiva grave ou profunda geralmente beneficia mais com implantes cocleares ou dispositivos prescritos por um terapeuta da fala, mas a investigação subjacente sobre a separação do som aplica-se a todo o espectro.

Panda Quantum hearing aid

Saiba mais sobre os aparelhos auditivos equipados com processamento de áudio avançado em ZXQMARCA2ZXQ.

Limitações desta pesquisa

O estudo utilizou misturas controladas de duas fontes em ambiente laboratorial, o que simplifica cenas acústicas do mundo real onde três, quatro ou muito mais fontes competem. Embora os participantes avaliassem os resultados percetivos, os dados de campo a longo prazo que mostram o desempenho destes algoritmos na escuta diária genuína fortaleceriam a confiança nos benefícios práticos.

Além disso, o grupo de implante coclear apresentou uma melhoria mais estreita do que o grupo com audição normal, sugerindo que o processamento do sinal de IC apresenta as suas próprias restrições. Os algoritmos otimizados para um tipo de aparelho auditivo podem não ser transferidos diretamente para outro. Não foram observados conflitos de financiamento ou interesses conflituantes na publicação.

Onde é que isso nos deixa

A aprendizagem profunda está a passar de novidade para ferramenta prática em tecnologia auditiva. Este trabalho demonstra que algoritmos treinados para separar e melhorar os sons ambientais podem proporcionar melhorias mensuráveis ​​e preferidas pelo ouvinte. À medida que os dispositivos auditivos vendidos sem receita médica e conectados se tornam populares, o poder computacional para executar estes algoritmos está a tornar-se disponível. A fase seguinte é integrar estes avanços em dispositivos reais e validá-los em diversos ambientes auditivos e populações de utilizadores.

Shekar, Ram CMC e John H L Hansen. "Separação de fontes ambientais baseada em aprendizagem profunda e melhoramento de som: Avanços para o implante coclear e ouvintes com audição normal." The Journal of the Acoustical Society of America, 2026. Obtido de PubMed. DOI: 10.1121/10.0042760

Reading next

Contate-nos

Precisa de ajuda para escolher o aparelho auditivo Panda® certo?

A nossa equipa de suporte pode ajudá-lo a comparar Panda® Stealth, Panda® Air e Panda® Quantum, responder a perguntas antes de encomendar ou ajudar com uma compra existente.