L’udito e Psicoacustica

di Mario Bon

Bozza del 10 dicembre 2012, 15 febbraio 2013

7 maggio 2019: parecchi paragrafi fanno riferimento al glossario che contiene notizie più aggiornate.

Paragrafi di questo capitolo:

Introduzione

La risposta in frequenza dell'orecchio

Localizzazione della sorgente

Dimensione della sorgente

Suono reale, Suono atteso, Suono (della) finestra

Battimenti del secondo ordine

Effetto Haas

Effetto McGurk

Effetto Franssen

Effetto Ventriloquo

Fusione Binaurale

Effetto Cocktail Party (Ascolto intenzionale o Ascolto Critico)

Mascheramento

Backward recognition masking (o informational masking)

Effetto Mozart

Gli effetti non lineari

Fatica da ascolto:

Distorsione aurale (vedere suono dell’amplificatore)

Ricostruzione della fondamentale mancante (rintracciamento della fondamentale o virtual pitch)

Il Terzo suono di Tartini

Effetto Zwicker o Zwicker Tone

Scala di Shepard

PAT: PsicoAcustica Transizionale

Effetto Specchio

Conclusioni

Bibliografia

Introduzione

La psicoacustica è una scienza relativamente giovane e in via di sviluppo. Un importante passo in avanti è stato fatto (negli anni ’60) con la definizione degli attributi del suono e più recentemente con il Modello Neurofisiologico. La definizione degli attributi del suono sposta l’attenzione dal dispositivo al suono prodotto dal dispositivo. Grazie alla definizione degli attributi del suono è possibile progettare un auditorio con caratteristiche acustiche predefinite. Negli ultimi anni gli studi si sono concentrati anche sugli effetti dovuti al padiglione auricolare (pinna). E’ stato anche evidenziato che il processo di localizzazione coinvolge la memoria, il riconoscimento di modelli (pattern matching), la vista, ecc. La psicoacustica, oggi, è un supporto fondamentale nella progettazione degli amplificatori e dei diffusori acustici. E’ praticamente certo che l’apparato uditivo svolga operazioni analoghe alla convoluzione di spettri se non anche una valutazione della coerenza.

L’udito ha due funzioni fondamentali: il controllo dell’ambiente e la comunicazione (riconoscimento della voce). Queste funzioni si sono affinate con l’evoluzione. Gli apparecchi per la riproduzione sonora sono sviluppatii “solo” negli ultimi cento anni: questi dispositivi riproducono suoni e situazioni nuove e “innaturali” che possono indurre vere e proprie illusioni acustiche. Per questo motivo molti esperimenti, condotti con toni sinusoidali puri, forniscono risultati incerti in quanto non direttamente riferibili alle condizioni reali.

Va tenuto conto, infatti, che l’apparato uditivo si sforza di dare sempre una interpretazione alle sensazioni sonore. Tale interpretazione, essendo basata sulla memoria pregressa, può essere giusta, sbagliata ma anche “inventata”. Come esistono le illusioni ottiche, così esistono le illusioni acustiche.

La psicoacustica studia i vari aspetti della percezione del suono.

Per la psicoacustica un fenomeno è accettabile quando viene percepito almeno dal 71% di una popolazione composta da individui con l’udito perfetto. Il soggetto medio quindi non risulta dalla media statistica su una popolazione indistinta (uomini, donne, giovani, vecchi, bambini) che fornirebbe un soggetto medio “mezzo sordo” ma da soggetti non patologici dall'udito perfetto.

Estendendo questo concetto il “fruitore medio di Alta Fedeltà” deve essere un “ascoltatore medio” istruito all’ascolto della musica dal vivo e alla musica riprodotta.

La psicoacustica distingue :

effetti del Primo Ordine

corrispondono ai movimenti della membrana basilare (hanno quindi una causa meccanica nel movimento della membrana basilare provocata, a sua volta, dal movimento del timpano).

effetti del Secondo Ordine

quelli che si generano all’interno del cervello senza apparenti cause fisiche e che non corrispondono a movimenti della membrana basilare (vedere per es. Battimenti).

L’apparato uditivo analizza il suono in intervalli che vanno da 35-50 fino a circa 100 millisecondi (Tempo o intervallo di integrazione). L’ intervallo di integrazione viene adattato al tipo di segnale: più breve per il parlato e più lungo per la musica. Questo giustifica la definizione dell’indice di chiarezza (o Chiarezza). La musica viene “trattata” dall’emisfero celebrale destro, il parlato da quello sinistro.

Una operazione che l’apparato uditivo esegue con grande efficacia è la soppressione degli echi che ricadono all’interno dell’intervallo di integrazioni. In pratica il cervello riesce ad associare a ciascun suono la sua riflessione e, se cade all’interno dell’intervallo di integrazione, la utilizza per rinforzare lo stimolo sonoro. In questo modo udiamo una eco distinta solo quando il ritardo tra il suono diretto ed il suono riflesso supera i 100 milli secondi. Se non fosse così sarebbe impossibile comprendere una conversazione in un ambiente chiuso. Recenti studi confermano che, per ottenere questo risultato, l’apparato uditivo esegue delle operazioni simili alla correlazione. In realtà dovremmo dire: se dovessimo implementare un sistema di riconoscimento delle eco come quello dell’apparato uditivo, dovremmo utilizzare le tecniche di correlazione.

La soppressione degli echi ha un effetto collaterale: l’aumento delle dimensioni apparenti della sorgente.

Scala dei tempi in secondi	Luogo di elaborazione	sensazione	Infuelnza (cultura, ambiente, stato)
primi 1 o 2 milli		localizzazione
60 micro – 60 milli	Orecchio interno	Altezza, intensità, timbro	Debole
Circa 0.1	Collegamento nervoso tra orecchio e corteccia	Transitori, timbro, direzionalità, identificazione, discriminazione
< 0.1	Corteccia cerebrale	Ritmo, messaggio musicale
	Emisfero sinistro	Breve termine (sequenzializzazione, parlato)
	Emisfero destro	Lungo termine (integrazione spaziale (visiva) e temporale (uditiva)	Forte
Luoghi e tempi della elaborazione del messaggio sonoro

La risposta in frequenza dell'orecchio

Ogni individuo ha un apparato uditivo con caratteristiche peculiari a cominciare dalla “risposta in frequenza”, sensibilità, tempo di integrazione, ecc. ecc. . Ne segue che difficilmente due individui “sentono” alla stesso modo e non c’è da stupirsi se qualcuno preferisce un tipo di suono (analogico) piuttosto di un altro (digitale).

Figura (a) sorgente di fronte al oggetto

Figura (b) sorgente a 90° (di fronte all'orecchio)

La figura qui sopra riporta la “risposta normalizzata” misurata all'ingresso del canale auricolare per dieci individui diversi ed è tratta da: "Recording Studio Design" di Philip Newell, pagina 28
Seconda Edizione 2008 Published by Elsevier Ltd. ISBN: 978-0-240-52086-5

Le risposte sono tutte marcatamente diverse con variazioni di parecchi dB proprio nella zona di maggior sensibilità. La causa di queste differenza è la diversa conformazione anatomica del padiglione auricolare (pinna), testa e anche spalle.

Per completezza riportiamo anche le curve di Loudness

Curve di Loudness

Queste curve rappresentano la sensibilità dell’orecchio al variare del livello dello stimolo.

Lo stimolo, in questo caso, sono toni puri (sinusoidali) con frequenza compresa tra 20 e 20000 Hz.

Il riferimento è posto a 1000 Hz.

Si leggono in questo modo. Preso come riferimento un tono puro a 1000 Hz con livello di 60 dB affinché un tono a 20 Hz sia percepito allo stesso livello deve essere amplificato di 42 dB circa (oltre 100 volte)

Per questo motivo, ascoltando a basso volume le frequenza basse sembrano più deboli.

Queste sono curve “medie” e variano da individuo a individuo

Localizzazione della sorgente : Vedere UDITO => Localizzazione nel Glossario

Dimensione della sorgente: Vedere UDITO => Localizzazione nel Glossario

Suono reale, Suono atteso, Suono (della) finestra

Il “suono reale” è il suono prodotto dalla sorgente originale nell’ambiente originale. Per esempio il suono di un pianoforte suonato in una sala da concerto e ascoltato dai posti centrali dalla quinta fila della platea.

Il “Suono atteso” è il suono che l’ascoltatore immagina (o desidera) per una certa sorgente. Per esempio un appassionato vorrebbe che il pianoforte suonasse secco e preciso (anche se la registrazione è stata fatta con un solo microfono a 10 metri di distanza in una chiesa). Il suono atteso consegue all’abitudine di ascoltare (un certo tipo di) musica riprodotta sempre con lo stesso impianto stereo senza confronti con le sorgenti reali (rara o nulla frequentazione dei concerti dal vivo). Chi ascolta lo stesso impianto per lungo tempo difficilmente poi trova alternative soddisfacenti (assuefazione). Non è detto che si tratti sempre di un effetto negativo: come minimo fa risparmiare soldi.

Siamo perfettamente in grado di capire quando un suono proviene da una finestra aperta (“Suono della finestra”) e siamo altrettanto in grado di sentire la differenza che c’è nell’ascoltare (per es. il rumore della città) stando affacciati alla finestra o dall’interno della stanza. Ciò dipende dalle riflessioni e diffrazioni sugli stipiti della finestra che definiscono la dimensione della sorgente.

Suono Reale: riconoscimento della voce e degli strumenti

riconosciamo una voce conosciuta dal vivo, dalla televisione, dalla radio, dal telefono, dal citofono di casa, nel rumore della folla.

Evidentemente questa voce è memorizzata con pattern diversi (in più versioni diverse). Il riconoscimento avviene su base spettrale (la membrana basilare è un analizzatore di spettro a finestra variabile).

Allo stesso modo riconosciamo il timbro degli strumenti musicali. Quando il suono che udiamo coincide con l’archetipo che teniamo in memoria la “fedeltà” è massima. In sostanza non esiste una “Alta Fedeltà” in assoluto ma tanti modelli di “fedeltà” personalizzati. Fortunatamente la maggior parte di questi modelli sono abbastanza simili.

Battimenti del secondo ordine

Il fenomeno dei battimenti del secondo ordine consiste nella sensazione di modulazione di ampiezza che si avverte quando lo stimolo è composto da due suoni puri che eccitano la membrana basilare in regioni che non si sovrappongono. La frequenza f2 sia posta inizialmente ad un valore f2 = 2 f1. Si può notare che per diverse differenze di fase iniziale fra le due componenti la forma d’onda cambia notevolmente. Se la differenza di fase si mantiene perfettamente costante, tuttavia, l’ascoltatore non percepirà alcuna differenza. Quando la frequenza f2 viene leggermente stonata rispetto all’ottava ( f2 = 2 f1 +e), la differenza di fase non rimane più costante. Il sistema uditivo percepisce in queste condizioni battimenti a frequenza fb = e (Figura 2.18). Battimenti del secondo ordine si ottengono anche stonando leggermente intervalli di quarta e di quinta con frequenze di battimento rispettivamente di fb = 3e e fb = 2e Hz. Questo fenomeno mette bene in risalto come il senso dell’udito sia insensibile a differenze di fase costanti nel tempo, ma non significa che sia sensibile alla variazione della fase nel nel tempo. Non dinostra nemmeno che l’apparato uditivo sia sensibile all’inviluppo.

Il battimento è la sensazione di fluttuazione del suono prodotta quando si odono due suoni di frequenza vicina ma in relazione non armonica. Indica l’incapacità dell’orecchio di risolvere due suoni di frequenza troppo vicina.

La distorsione aurale dell’orecchio provoca la sensazione di percepire la frequenza differenza (frequenza dell’inviluppo). In pratica il sistema uditivo non è sensibile all’inviluppo ma provoca distorsione per intermodulazione. Vedi anche terzo suono del Tartini

Questo è un effetto del secondo ordine.

Effetto Haas: Vedere UDITO => Localizzazione nel Glossario

Effetto McGurk: Vedere UDITO => Localizzazione nel Glossario

Effetto Franssen: Vedere UDITO => Localizzazione nel Glossario

Effetto Ventriloquo : Vedere UDITO => Localizzazione nel Glossario

Fusione Binaurale: Vedere UDITO => Localizzazione nel Glossario

Effetto Cocktail Party (Ascolto intenzionale o Ascolto Critico): Vedere UDITO => Localizzazione nel Glossario

Mascheramento: Vedere UDITO => Localizzazione nel Glossario

Backward recognition masking (o informational masking): Vedere UDITO => Localizzazione nel Glossario

Effetto Mozart: Vedere UDITO => Localizzazione nel Glossario

Gli effetti non lineari

L’apparato uditivo non è un sistema lineare: non lo è l’orecchio (inteso come “microfono”) e non lo sono i processi celebrali che elaborano il suono. Ne segue che non vale il principio di sovrapposizione degli effetti così come lo enunciamo nell’ ambito della teoria dei sistemi.

Per esempio se inviamo alle due orecchie, tramite una cuffia, due toni sinusoidali di frequenza vicina (F1 all’orecchio destro e F2 all’orecchio sinistro) il cervello percepisce anche un tono di frequenza pari alla differenza F1-F2. Questo terzo suono si genera nel cervello ed è un fenomeno del secondo ordine. Attenzione però perché questa situazione è innaturale sia per l’uso delle cuffie che per uso di toni sinusoidali puri come stimoli. Si tratta comunque di un caso particolare di Fusione Binaurale.

Fatica da ascolto:

La Fatica da Ascolto è la sensazione di affaticamento, fino alla cefalea, che deriva dallo sforzo prolungato necessario per comprendere un messaggio sonoro non univoco. Le cause possono essere diverse:

- eccessivo riverbero dell’ambiente (riduce l’intelligibilità del parlato)

- rumore (maschera il segnale utile)

- distorsione non lineare (nei sistemi di riproduzione, maschera il segnale utile)

- programmi musicali eccessivamente sovramodulati

- risposta in frequenza eccessivamente sbilanciata (nei sistemi di riproduzione)

- un suono dal timbro sgradevole (gesso sulla lavagna, lametta sul vetro)

- altre cause di tipo psicologico.

La Fatica da ascolto è anche un attributo del suono del diffusore acustico. Si veda il capitolo dedicato agli attributi del suono.

Distorsione aurale (vedere suono dell’amplificatore) Vedere UDITO => Localizzazione nel Glossario

Ricostruzione della fondamentale mancante (rintracciamento della fondamentale o virtual pitch): quando il nostro orecchio percepisce un suono composto da una successione di armoniche tipo 100, 150 200, 250, 300, 350… Hz tende “automaticamente” ad aggiungere la fondamentale mancante (in questo esempio 50 Hz). In sostanza si ha la sensazione di sentire la fondamentale (la nota più bassa) anche se fisicamente questa non è presente. I mini diffusori si avvantaggiano di questo effetto dando l’illusione di una maggiore estensione verso le basse frequenze. Si noto che il tono a 50 Hz corrisponde alla differenza di due armoniche successive quindi è una conseguenza della distorsione di intermodulazione dell’orecchio.

Il Terzo suono di Tartini: Vedere UDITO => Localizzazione nel Glossario

Effetto Zwicker o Zwicker Tone: Vedere UDITO => Localizzazione nel Glossario

Scala di Shepard: Vedere UDITO => Localizzazione nel Glossario

PAT: PsicoAcustica Transizionale: Vedere UDITO => Localizzazione nel Glossario

Effetto Specchio: Vedere UDITO => Localizzazione nel Glossario

Conclusioni

Questa breve trattazione non esaurisce tutti gli aspetti o gli effetti psicoacustici della percezione sonora ma almeno rende l’idea di quanto sia complicato riprodurre o simulare il comportamento dell’apparato uditivo.

La determinazione della distribuzione spaziale delle sorgenti (sia come posizione che come dimensioni) coinvolge una serie di meccanismi che dipendono dall’udito, dalla vista, dalla memoria, ecc. Per un sistema di riproduzione collocare gli strumenti nello spazio con le giuste dimensioni è il compito più difficile perché richiede caratteristiche ottimali per tutti i dispositivi presenti nella catena. Tuttavia se la registrazione dell’evento sonoro non contiene informazioni sulla localizzazione (per esempio se la ripresa è stata eseguita con i microfono molto vicini agli strumenti) non c’è diffusore al mondo in grado di ricostruirla.

Bibliografia

Beranek, L. L.	Acoustics. McGraw-Hill Book Company ISBN 07-004835-5 e ISBN 0-88318-494-X	1954
Spagnolo	Manuale di Acustica Applicata, UTET	2001
F. Alton Everest	Manuale di acustica. Milano: Hoepli	2002
Beranek, L. L.	Concert and Opera Houses – Spinger – seconda edizione ISBN 0-387-95524-0	2004
Cingolati - Spagnolo	Acustica Musicale e Architettonica, UTET	2005

Sean E. Olive and Floyd E. Toole

National Research Council, Ottawa

The Detection of Reflections in Typical Rooms

Floyd E. Toole

Vice President Harman International Industries, Inc

Loudspeakers and Rooms for Multichannel Audio Reproduction (perte 1,2,3 e 4)

Floyd E. Toole,

Vice President Harman International Industries, Inc

The Science of Audio