Les nouvelles techniques d'apprentissage profond aident les utilisateurs d'implants cochléaires et d'appareils auditifs conventionnels à distinguer les sons environnementaux du bruit de fond.
Toute personne ayant une déficience auditive connaît le défi : une cornée de voiture blarifie pendant que vous essayez d'entendre la conversation; la cuisine étourdit pendant que vous écoutez un podcast; la nature sonne mêlée à la ménagère. Les personnes ayant une audition normale gèrent cela à travers une sorte de tri neuronal, isolant rapidement le son sur lequel elles veulent se concentrer.
Des chercheurs de l'Université du Texas à Dallas ont essayé de déterminer si l'intelligence artificielle pouvait améliorer la façon dont les appareils auditifs manipulent les sons environnementaux concurrents. Leurs efforts n'étaient pas de la parole; c'était la riche couche d'événements acoustiques qui composent la vie quotidienne - feuilles bruissantes, chiens aboyants, eau courante, portes claqueuses.
Titre: Séparation de source environnementale fondée sur l'apprentissage profond et amélioration du son : progrès pour les implants cochléaires et les auditeurs auditifs normaux
Auteurs: Ram C M C Shekar, John H L Hansen
Affiliations:0 Centre pour systèmes d'expression robustes - Cochlear Implant Processing Laboratory, The University of Texas à Dallas
Journal officiel: 0 Le Journal de la Société Acoustique d'Amérique - Avril 2026
Type d'étude:0 Étude expérimentale avec des évaluations de l'auditeur humain
Source: - C'est pas vrai. DOI: 10.1121/10.0042760
Contexte : Pourquoi les chercheurs ont regardé ceci
Les utilisateurs d'implants cochléaires sont confrontés à des défis particuliers avec une perception du son environnemental.Alors que la technologie moderne de l'IC excelle dans la transmission des signaux de parole, les signatures acoustiques les plus diffuses et variables des événements environnementaux - chants d'oiseaux, précipitations, trafic - restent plus difficiles à traiter.
Le défi technique est réel : lorsque plusieurs sources sonores se chevauchent, les séparer nécessite une sophistication computationnelle. Le traitement audio traditionnel a progressé progressivement, mais l'apprentissage profond offre un nouveau chemin. En formant des réseaux neuronaux sur de grandes bibliothèques de sons étiquetés et leurs mélanges, les chercheurs peuvent enseigner des algorithmes pour isoler des sources spécifiques même dans des scènes bruyantes et complexes.
Comment l'étude a été réalisée
Shekar et Hansen ont développé un cadre expérimental qui imitait les scénarios d'écoute du monde réel. Ils ont créé des mélanges sonores à deux sources associant un son « cible » (comme les précipitations ou les oiseaux) à un son « interférence » concurrent. Les utilisateurs de CI et les personnes ayant une audition normale ont écouté trois versions de chaque mélange : l'audio mixte brut comme base de référence, l'audio traité en utilisant la séparation des sources seule et l'audio qui combine la séparation des sources avec la propre technique d'amélioration des chercheurs pour les sons non linguistiques.
L'algorithme de séparation des sources a utilisé une architecture d'apprentissage profond appelée SUDORMEND (Successive Downsampling and Resampling of Multi-Resolution Features network).Les auditeurs ont évalué l'audio traité sur trois dimensions : réduction des interférences, qualité audio et distorsion.
Ce que les chercheurs ont trouvé
Les résultats différaient significativement entre les deux groupes d'auditeurs. Les utilisateurs d'implants cochléaires ont montré une amélioration statistiquement significative de la réduction de l'interférence, mais seulement pour les sons naturels associés à des interférences de catégorie (F=4,935, p=0,0175).
Les auditeurs auditifs normaux ont montré des gains beaucoup plus importants, qui ont montré une réduction de l'interférence dans toutes les catégories sonores non linguistiques testées, avec des valeurs statistiques très significatives (valeurs F allant de 8,481 à 32,37, valeurs p bien inférieures à 0,001). Les deux groupes - implant cochléaire et audition normale - ont exprimé une forte préférence pour l'approche combinée de séparation et d'amélioration de la source lorsqu'ils écoutent les sons de la nature et les bruits domestiques tels que la circulation de l'eau ou les éclaboussures de vaisselle.
Le contraste est révélateur : lorsque vous donnez à l'algorithme la liberté d'améliorer la perception sonore non linguistique au-delà du traitement axé sur la parole, les utilisateurs remarquent et préfèrent le résultat. Le fait que les auditeurs auditifs normaux voient une amélioration plus large suggère que les appareils auditifs pourraient bénéficier substantiellement d'algorithmes optimisés pour les paysages sonores environnementaux, et non pas seulement la conversation.
Ce que cela signifie pour les personnes ayant une perte auditive
Aujourd'hui, la plupart des appareils auditifs et des implants cochléaires classiques privilégient l'intelligibilité de la parole, et à juste titre, puisque la conversation est au cœur de la vie quotidienne. Mais les humains ne vivent pas dans des mondes exclusivement parlés. La richesse de l'expérience acoustique comprend la musique, le rire, la nature, les sons d'alarme et les signaux sonores subtils qui nous aident à naviguer et à profiter de notre environnement.
La recherche démontre que l'apprentissage profond peut démêler les sources environnementales qui se chevauchent et améliorer leur clarté perceptuelle. Plus important encore, elle démontre que les auditeurs ayant une perte auditive préfèrent activement ces améliorations.
Promouvoir la séparation des sons dans la technologie auditive moderne
Les résultats de l'étude sur la séparation des sources sonores sont exactement le genre de frontière technologique que la FDA a approuvé en vente libre et les catégories d'appareils auditifs directs au consommateur ont rendu possible. Les entreprises ont maintenant la piste pour déployer le traitement audio avancé dans les appareils auditifs sans le modèle traditionnel de clinique.
Des appareils comme Panda Quantum intègrent des tests auditifs cliniquement validés avec réduction du bruit adaptative et connectivité Bluetooth pour téléphone et musique. L'ajout de la séparation des sources apprises - formé sur les paysages sonores réels - représente la prochaine couche de capacité. L'algorithme fait le dur travail computationnel de l'isolant quelles sources comptent, laissant l'utilisateur de l'appareil auditif libre de se concentrer sur ce qu'il veut entendre.
Pour les pertes auditives légères à modérées, les modèles en vente libre peuvent maintenant inclure ce genre de traitement avancé. La perte auditive grave ou profonde bénéficie souvent davantage des implants cochléaires ou des dispositifs d'ordonnance installés par un audiologue, mais la recherche sous-jacente sur la séparation du son s'applique à l'ensemble du spectre.

En savoir plus sur les appareils auditifs équipés d'un traitement audio avancé à Panda Quantum.
Limites de cette recherche
L'étude a utilisé des mélanges à deux sources contrôlés dans un laboratoire, ce qui simplifie les scènes acoustiques réelles où trois, quatre ou beaucoup d'autres sources sont en concurrence. Alors que les participants ont évalué les résultats perceptuels, des données de terrain à long terme montrant comment ces algorithmes fonctionnent dans une écoute quotidienne authentique renforceraient la confiance dans les avantages pratiques.
De plus, la cohorte d'implants cochléaires a montré une amélioration plus étroite que le groupe auditif normal, ce qui laisse entendre que le traitement des signaux d'IC présente ses propres contraintes. Les algorithmes optimisés pour un type d'appareil auditif ne peuvent pas être transférés directement à un autre.
Où cela nous laisse
L'apprentissage profond passe de la nouveauté à l'outil pratique de la technologie auditive. Ce travail démontre que les algorithmes formés pour séparer et améliorer les sons environnementaux peuvent apporter des améliorations mesurables et préférées à l'auditeur. À mesure que les appareils auditifs connectés et en vente libre deviennent courants, la puissance de calcul pour exécuter ces algorithmes devient disponible. La prochaine phase intègre ces avancées dans les appareils réels et les valide dans divers environnements d'écoute et les populations d'utilisateurs.
Shekar, Ram C M C, et John H L Hansen. "Deep learning-based source separation and sound upgrade: Advancements for cochlear implant and normal health auditeurs." The Journal of the Acoustic Society of America, 2026. Extrait de PubMed. DOI: 10.1121/10.0042760