L’audition binaurale est nécessaire pour localiser avec précision une source sonore. Il est également impliqué dans la détermination de la distance d’une source sonore et la distinction d’un son d’intérêt d’un arrière-plan bruyant.
Audition binaurale et monaurale
Comme l’audition est principalement traitée par une paire d’organes (les deux oreilles), une distinction est faite entre l’écoute avec une seule oreille (audition monaurale) et avec les deux oreilles (audition binaurale).
Traitement binaural
Lorsqu’un son a une stimulation égale ou une sensation identique aux deux oreilles, on parle de stimulation « diotique ». En revanche, lorsque les entrées des deux oreilles sont différentes, le stimulus est appelé « dichotique ».
Dans les environnements naturels, seule l’audition dichotique existe, ce qui permet un traitement binaural. Si les deux oreilles recevaient les mêmes informations, nous ne serions pas en mesure de suivre les conversations dans des situations bruyantes, de localiser les sources sonores et de définir avec précision notre environnement sonore.
Localisation des sources sonores
La localisation se produit principalement sur les sources sonores primaires qui dominent l’environnement auditif. Il devient moins précis lorsque plusieurs sources sonores sont superposées et lorsque des réverbérations créent des sources secondes.
D’une manière générale, l’oreille humaine utilise divers indices pour localiser un son dans l’espace : dans le plan horizontal (également appelé « azimut »), les indices primaires sont le résultat des différences entre les signaux arrivant et les deux oreilles (indices binauraux). Dans le plan vertical (ou élévation), les signaux primaires sont monauraux – ils sont générés par la modification d’un son par le torse, la tête et l’oreille externe de l’auditeur.
Localisation dans le plan horizontal
Différence de temps interaurale (ITD)
La différence de temps entre l’arrivée d’une onde sonore à chaque oreille est un repère important pour estimer la position d’un son dans le plan horizontal.

Un son généré par une source localisée « S », dans un plan horizontal créé par l’angle α et une distance r du centre de la tête, aura un itinéraire différent pour atteindre les oreilles droite (R) et gauche (L).
Dans ce cas, la distance SL est supérieure à SR et le son arrivera donc plus tôt à l’oreille droite qu’à gauche. La différence dans l’heure d’arrivée de l’onde sonore à chaque oreille est appelée différence de temps interaurale (ITD). Lorsque la source sonore est à égale distance des deux oreilles (à 0° ou 180°), la DTI est égale à 0.
Au contraire, la DTI est à son maximum lorsque la source sonore est à ±90°. À ce stade, il est égal à environ 0,7 ms pour une tête humaine de taille moyenne.
ITD est un signal fondamental pour localiser la source d’un son dont la fréquence est inférieure à 1500 Hz. Au-dessus de 1500 Hz, les indices ITD deviennent ambigus. Cependant, dans le cas de sons complexes, l’ITD de l’enveloppe (modulation lente) des hautes fréquences peut être perçue. C’est ce qu’on appelle la différence de temps de l’enveloppe interaurale.
Différence de niveau interaural (ILD)
L’effet d’ombrage de la tête fait référence à l’absorption d’une partie de l’énergie d’un son par la tête elle-même. Il provoque une différence de niveau interaural (ILD), qui correspond à la différence d’intensité du son à chaque oreille. Cependant, ce signal dépend fortement de la composante fréquentielle du son. Lorsqu’elle est inférieure à 1500 Hz, la ILD est presque inexistante. En revanche, pour les fréquences supérieures à 1500 Hz, ILD est un signal utile.
Ainsi, la fusion ILD et ITD permet une localisation assez précise dans le plan horizontal. Néanmoins, une situation confuse persiste aux azimuts 0° et 180° où ILD et ITD sont presque identiques identiques, créant ce que l’on appelle le cône de confusion.
Localisation verticale
La capacité de localiser un son dans un plan vertical est souvent attribuée à l’analyse de la composition spectrale du son à chaque oreille. En fait, les ondes sonores arrivant aux oreilles sont rebondies à partir de structures telles que les épaules ou les pennes, et ces rebonds interfèrent avec le son lorsqu’il pénètre dans le conduit auditif. Cette interférence provoque des modifications spectrales, des renforcements (pics spectraux) ou des détériorations (lacunes spectrales) dans certaines zones de fréquence qui permettent la localisation d’une source sonore dans le plan vertical.
Au cours de la vie, une multitude de fonctions de transfert sont apprises, qui correspondent à différentes directions pour les sources sonores. Ces filtres mémorisés sont utilisés pour pondérer le spectre sonore et sont utilisés pour désambiguer la localisation des sons dans le cône de confusion.
Ce diagramme (de J. Garas) montre la modification spectrale de l’onde sonore d’origine en fonction de l’azimut de la source (de haut en bas: -10°, 0°, 10°). Il est évident que l’écart spectral se déplace de gauche à droite (survolez les flèches avec votre souris).
Remarque : La localisation de la source dans le plan vertical reste moins précise que dans le plan horizontal.
Distance
Les variations des niveaux d’intensité et la relation entre l’énergie des sons directs et ceux qui sont rebondis sont les principaux indices qui nous permettent d’approcher la distance d’une source sonore.
Variations du niveau d’intensité
Une source sonore en mouvement a un niveau d’intensité variable. S’il se rapproche, le niveau d’intensité augmente, s’il s’éloigne, l’intensité diminue. Ce signal ne peut être utilisé que dans un environnement non réverbérant (comme une chambre anéchoïque). Dans un contexte réverbérant, la distribution des ondes sonores, et par conséquent leurs niveaux d’intensité respectifs, dépend des propriétés de rebond de la pièce.
Relation entre les champs sonores direct et réverbérant
Près d’une source sonore, le champ sonore direct domine. Plus on s’éloigne de la source sonore, plus le champ réverbérant, créé par la réflexion des ondes directes sur le plafond et les murs de l’environnement, domine. Par conséquent, l’évolution du rapport entre champ direct et champ réverbérant donne une indication du mouvement, et donc de la distance, de la source sonore.
Résolution de situations confuses
Les êtres humains font instinctivement de petits mouvements de tête qui créent de nouveaux indices binauraux et monauraux. Ces nouveaux indices sont utilisés pour augmenter la précision de la localisation du son, et pour minimiser certaines ambiguïtés de localisation, telles que le cône de confusion trouvé à 0° et 180° azimut.