L’udito e Psicoacustica
di Mario Bon
Bozza del 10 dicembre 2012, 15
febbraio 2013
7 maggio 2019: parecchi paragrafi
fanno riferimento al glossario che contiene notizie più aggiornate.
Paragrafi di questo capitolo:
Introduzione
La risposta in frequenza dell'orecchio
Localizzazione della sorgente
Dimensione della sorgente
Suono reale, Suono atteso, Suono (della) finestra
Battimenti del secondo ordine
Effetto Haas
Effetto McGurk
Effetto Franssen
Effetto Ventriloquo
Fusione Binaurale
Effetto Cocktail Party (Ascolto intenzionale o Ascolto
Critico)
Mascheramento
Backward recognition masking (o informational masking)
Effetto Mozart
Gli effetti non lineari
Fatica da ascolto:
Distorsione aurale (vedere suono dell’amplificatore)
Ricostruzione della fondamentale mancante (rintracciamento
della fondamentale o virtual pitch)
Il Terzo suono di Tartini
Effetto Zwicker o Zwicker Tone
Scala di Shepard
PAT: PsicoAcustica Transizionale
Effetto Specchio
Conclusioni
Bibliografia
Introduzione
La psicoacustica è una scienza relativamente giovane e in via
di sviluppo. Un importante passo in avanti
è stato fatto (negli anni ’60) con la definizione degli attributi del
suono e più recentemente con il Modello Neurofisiologico. La definizione degli attributi del
suono sposta l’attenzione dal dispositivo al suono prodotto dal dispositivo.
Grazie alla definizione degli attributi del suono è possibile progettare un auditorio con caratteristiche acustiche
predefinite. Negli ultimi anni gli studi si sono concentrati anche
sugli effetti dovuti al padiglione auricolare (pinna). E’ stato anche
evidenziato che il processo di localizzazione coinvolge la memoria, il riconoscimento di modelli
(pattern matching), la vista, ecc. La psicoacustica, oggi, è un supporto fondamentale nella
progettazione degli amplificatori e dei diffusori acustici. E’ praticamente
certo che l’apparato uditivo svolga operazioni analoghe alla convoluzione di
spettri se non anche una valutazione della coerenza.
L’udito ha due funzioni
fondamentali: il controllo dell’ambiente e la comunicazione (riconoscimento
della voce). Queste funzioni si sono affinate con l’evoluzione. Gli apparecchi
per la riproduzione sonora sono sviluppatii “solo” negli ultimi cento
anni: questi dispositivi riproducono
suoni e situazioni nuove e “innaturali” che possono indurre vere e proprie
illusioni acustiche. Per questo motivo molti esperimenti, condotti con toni
sinusoidali puri, forniscono risultati incerti in quanto non direttamente
riferibili alle condizioni reali.
Va tenuto conto, infatti, che
l’apparato uditivo si sforza di dare sempre una interpretazione alle sensazioni
sonore. Tale interpretazione, essendo basata sulla memoria pregressa, può
essere giusta, sbagliata ma anche “inventata”. Come esistono le illusioni
ottiche, così esistono le illusioni acustiche.
La psicoacustica studia i vari aspetti della percezione del
suono.
|
Per la psicoacustica un fenomeno è accettabile quando
viene percepito almeno dal 71% di una popolazione composta da individui con
l’udito perfetto. Il
soggetto medio quindi non risulta dalla media statistica su una popolazione
indistinta (uomini, donne, giovani, vecchi, bambini) che fornirebbe un
soggetto medio “mezzo sordo” ma da soggetti non patologici dall'udito
perfetto. |
Estendendo questo concetto il “fruitore
medio di Alta Fedeltà” deve essere un “ascoltatore medio” istruito all’ascolto
della musica dal vivo e alla musica riprodotta.
La psicoacustica distingue :
|
effetti del Primo Ordine |
corrispondono ai movimenti della membrana basilare (hanno
quindi una causa meccanica nel movimento della membrana basilare provocata, a
sua volta, dal movimento del timpano). |
|
effetti del Secondo Ordine |
quelli che si generano all’interno del cervello senza
apparenti cause fisiche e che non corrispondono a movimenti della membrana
basilare (vedere per es. Battimenti). |
L’apparato uditivo analizza il suono in intervalli che vanno
da 35-50 fino a circa 100 millisecondi (Tempo o intervallo di integrazione). L’
intervallo di integrazione viene adattato al tipo di segnale: più breve per il
parlato e più lungo per la musica. Questo giustifica la definizione dell’indice
di chiarezza (o Chiarezza). La musica viene “trattata” dall’emisfero celebrale
destro, il parlato da quello sinistro.
Una operazione che l’apparato uditivo esegue con grande
efficacia è la soppressione degli echi che ricadono all’interno dell’intervallo
di integrazioni. In pratica il cervello riesce ad associare a ciascun suono la
sua riflessione e, se cade all’interno dell’intervallo di integrazione, la
utilizza per rinforzare lo stimolo sonoro. In questo modo udiamo una eco
distinta solo quando il ritardo tra il suono diretto ed il suono riflesso
supera i 100 milli secondi. Se non fosse così sarebbe impossibile comprendere
una conversazione in un ambiente chiuso. Recenti studi confermano che, per
ottenere questo risultato, l’apparato uditivo esegue delle operazioni simili alla correlazione. In realtà dovremmo
dire: se dovessimo implementare un sistema di riconoscimento delle eco come
quello dell’apparato uditivo, dovremmo utilizzare le tecniche di correlazione.
La soppressione degli echi ha un effetto collaterale: l’aumento
delle dimensioni apparenti della sorgente.

|
Scala dei tempi in secondi |
Luogo di elaborazione |
sensazione |
Infuelnza (cultura, ambiente, stato) |
|
primi 1 o 2 milli |
|
localizzazione |
|
|
60 micro – 60 milli |
Orecchio interno |
Altezza, intensità, timbro |
Debole |
|
Circa 0.1 |
Collegamento nervoso tra orecchio e corteccia |
Transitori, timbro, direzionalità, identificazione,
discriminazione |
|
|
< 0.1 |
Corteccia cerebrale |
Ritmo, messaggio musicale |
|
|
|
Emisfero sinistro |
Breve termine (sequenzializzazione, parlato) |
|
|
|
Emisfero destro |
Lungo termine (integrazione spaziale (visiva) e temporale
(uditiva) |
Forte |
|
Luoghi e tempi della elaborazione
del messaggio sonoro |
|||
La risposta in frequenza dell'orecchio
Ogni individuo ha un apparato uditivo con caratteristiche
peculiari a cominciare dalla “risposta in frequenza”, sensibilità, tempo di
integrazione, ecc. ecc. . Ne segue che difficilmente due individui “sentono” alla stesso modo e non c’è da
stupirsi se qualcuno preferisce un tipo di suono (analogico) piuttosto di un
altro (digitale).
|
|
Figura (a) sorgente di fronte al oggetto
|
La figura qui sopra riporta la “risposta normalizzata”
misurata all'ingresso del canale auricolare per dieci individui diversi ed è
tratta da: "Recording Studio Design" di Philip Newell, pagina 28
Seconda Edizione 2008 Published by Elsevier Ltd. ISBN: 978-0-240-52086-5
Le risposte sono tutte marcatamente diverse con variazioni di parecchi dB
proprio nella zona di maggior sensibilità. La causa di queste differenza è la
diversa conformazione anatomica del padiglione auricolare (pinna), testa e
anche spalle.
Per completezza riportiamo anche le curve di Loudness
|
|
Curve di
Loudness Queste
curve rappresentano la sensibilità dell’orecchio al variare del livello dello
stimolo. Lo stimolo,
in questo caso, sono toni puri (sinusoidali) con frequenza compresa tra 20 e
20000 Hz. Il
riferimento è posto a 1000 Hz. Si
leggono in questo modo. Preso come riferimento un tono puro a 1000 Hz con
livello di 60 dB affinché un tono a 20 Hz sia percepito allo stesso livello
deve essere amplificato di 42 dB circa (oltre 100 volte) Per
questo motivo, ascoltando a basso volume le frequenza basse sembrano più
deboli. Queste
sono curve “medie” e variano da individuo a individuo |
Localizzazione della sorgente : Vedere
UDITO => Localizzazione nel Glossario
Dimensione della sorgente: Vedere UDITO => Localizzazione
nel Glossario
Suono reale, Suono atteso, Suono (della) finestra
Il “suono reale” è il suono
prodotto dalla sorgente originale nell’ambiente originale. Per esempio il suono
di un pianoforte suonato in una sala da concerto e ascoltato dai posti centrali
dalla quinta fila della platea.
Il “Suono atteso”
è il suono che l’ascoltatore immagina (o desidera) per una certa sorgente. Per
esempio un appassionato vorrebbe che il pianoforte suonasse secco e preciso
(anche se la registrazione è stata fatta con un solo microfono a 10 metri di
distanza in una chiesa). Il suono atteso consegue all’abitudine di ascoltare
(un certo tipo di) musica riprodotta sempre con lo stesso impianto stereo senza
confronti con le sorgenti reali (rara o nulla frequentazione dei concerti dal
vivo). Chi ascolta lo stesso impianto per lungo tempo difficilmente poi trova
alternative soddisfacenti (assuefazione). Non è detto che si tratti sempre di
un effetto negativo: come minimo fa risparmiare soldi.
Siamo
perfettamente in grado di capire quando un suono proviene da una finestra
aperta (“Suono della finestra”) e siamo altrettanto in grado di sentire la differenza
che c’è nell’ascoltare (per es. il rumore della città) stando affacciati alla
finestra o dall’interno della stanza. Ciò dipende dalle riflessioni e
diffrazioni sugli stipiti della finestra che definiscono la dimensione della
sorgente.
|
Suono Reale: riconoscimento della voce e degli strumenti riconosciamo una voce conosciuta dal vivo, dalla televisione, dalla
radio, dal telefono, dal citofono di casa, nel rumore della folla. Evidentemente questa voce è memorizzata con pattern diversi (in più
versioni diverse). Il riconoscimento avviene su base spettrale (la membrana
basilare è un analizzatore di spettro a finestra variabile). Allo stesso modo riconosciamo il timbro degli strumenti
musicali. Quando il suono che udiamo coincide con l’archetipo che teniamo in
memoria la “fedeltà” è massima. In sostanza non esiste una “Alta
Fedeltà” in assoluto ma tanti modelli di “fedeltà” personalizzati.
Fortunatamente la maggior parte di questi modelli sono abbastanza simili. |
Battimenti
del secondo ordine
Il fenomeno
dei battimenti del secondo ordine consiste nella sensazione di modulazione di
ampiezza che si avverte quando lo stimolo è composto da due suoni puri che
eccitano la membrana basilare in regioni che non si sovrappongono. La frequenza
f2 sia posta inizialmente ad un valore f2 = 2 f1. Si può notare che per diverse
differenze di fase iniziale fra le due componenti la forma d’onda cambia
notevolmente. Se la differenza di fase si mantiene perfettamente costante,
tuttavia, l’ascoltatore non percepirà alcuna differenza. Quando la frequenza f2
viene leggermente stonata rispetto all’ottava ( f2 = 2 f1 +e), la differenza di
fase non rimane più costante. Il sistema uditivo percepisce in queste
condizioni battimenti a frequenza fb = e (Figura 2.18). Battimenti del secondo
ordine si ottengono anche stonando leggermente intervalli di quarta e di
quinta con frequenze di battimento
rispettivamente di fb = 3e e fb = 2e Hz. Questo fenomeno mette bene in risalto
come il senso dell’udito sia insensibile a differenze di fase costanti nel
tempo, ma non significa che sia sensibile alla variazione della fase nel nel
tempo. Non dinostra nemmeno che l’apparato uditivo sia sensibile all’inviluppo.
|
|
Il battimento
è la sensazione di fluttuazione del suono prodotta quando si odono due suoni
di frequenza vicina ma in relazione non armonica. Indica l’incapacità
dell’orecchio di risolvere due suoni di frequenza troppo vicina. La
distorsione aurale dell’orecchio provoca la sensazione di percepire la
frequenza differenza (frequenza dell’inviluppo). In pratica il sistema
uditivo non è sensibile all’inviluppo ma provoca distorsione per
intermodulazione. Vedi anche terzo suono del Tartini Questo è
un effetto del secondo ordine. |
Effetto Haas: Vedere UDITO => Localizzazione
nel Glossario
Effetto
McGurk: Vedere
UDITO => Localizzazione nel Glossario
Effetto Franssen: Vedere UDITO => Localizzazione nel Glossario
Effetto
Ventriloquo :
Vedere UDITO => Localizzazione nel Glossario
Fusione Binaurale: Vedere UDITO => Localizzazione
nel Glossario
Effetto Cocktail Party (Ascolto intenzionale o Ascolto
Critico): Vedere UDITO => Localizzazione nel Glossario
Mascheramento: Vedere UDITO => Localizzazione nel Glossario
Backward recognition masking (o informational
masking): Vedere
UDITO => Localizzazione nel Glossario
Effetto Mozart: Vedere UDITO => Localizzazione nel Glossario
Gli effetti non lineari
L’apparato uditivo non è un sistema lineare: non lo è
l’orecchio (inteso come “microfono”) e non lo sono i processi celebrali che
elaborano il suono. Ne segue che non vale il principio di sovrapposizione degli
effetti così come lo enunciamo nell’ ambito della teoria dei sistemi.
Per esempio se inviamo alle due orecchie, tramite una cuffia, due toni sinusoidali di frequenza vicina (F1 all’orecchio destro e F2 all’orecchio sinistro) il cervello percepisce anche un tono di frequenza pari alla differenza F1-F2. Questo terzo suono si genera nel cervello ed è un fenomeno del secondo ordine. Attenzione però perché questa situazione è innaturale sia per l’uso delle cuffie che per uso di toni sinusoidali puri come stimoli. Si tratta comunque di un caso particolare di Fusione Binaurale.
Fatica da ascolto:
La Fatica da Ascolto è la sensazione di affaticamento, fino alla cefalea, che deriva dallo sforzo prolungato necessario per comprendere un messaggio sonoro non univoco. Le cause possono essere diverse:
-
eccessivo
riverbero dell’ambiente (riduce l’intelligibilità del parlato)
-
rumore
(maschera il segnale utile)
-
distorsione
non lineare (nei sistemi di riproduzione, maschera il segnale utile)
-
programmi
musicali eccessivamente sovramodulati
-
risposta
in frequenza eccessivamente sbilanciata (nei sistemi di riproduzione)
-
un
suono dal timbro sgradevole (gesso sulla lavagna, lametta sul vetro)
-
altre
cause di tipo psicologico.
La Fatica
da ascolto è anche un attributo del suono del diffusore acustico. Si veda il
capitolo dedicato agli attributi del suono.
Distorsione
aurale (vedere suono dell’amplificatore) Vedere UDITO => Localizzazione nel Glossario
Ricostruzione della fondamentale mancante (rintracciamento
della fondamentale o virtual pitch): quando il nostro orecchio percepisce un suono composto da
una successione di armoniche tipo 100, 150 200, 250, 300, 350… Hz tende
“automaticamente” ad aggiungere la fondamentale mancante (in questo esempio 50
Hz). In sostanza si ha la sensazione di sentire la fondamentale (la nota più
bassa) anche se fisicamente questa non è presente. I mini diffusori si
avvantaggiano di questo effetto dando l’illusione di una maggiore estensione
verso le basse frequenze. Si noto che il tono a 50 Hz corrisponde alla
differenza di due armoniche successive quindi è una conseguenza della
distorsione di intermodulazione dell’orecchio.
Il Terzo suono di Tartini: Vedere UDITO => Localizzazione nel Glossario
Effetto Zwicker o Zwicker Tone: Vedere UDITO => Localizzazione
nel Glossario
Scala di
Shepard: Vedere
UDITO => Localizzazione nel Glossario
PAT:
PsicoAcustica Transizionale:
Vedere UDITO => Localizzazione nel Glossario
Conclusioni
Questa breve trattazione non esaurisce tutti gli aspetti o
gli effetti psicoacustici della percezione sonora ma almeno rende l’idea di
quanto sia complicato riprodurre o simulare il comportamento dell’apparato
uditivo.
La determinazione della distribuzione spaziale delle
sorgenti (sia come posizione che come dimensioni) coinvolge una serie di
meccanismi che dipendono dall’udito, dalla vista, dalla memoria, ecc. Per un
sistema di riproduzione collocare gli strumenti nello spazio con le giuste
dimensioni è il compito più difficile
perché richiede caratteristiche ottimali per tutti i dispositivi presenti nella
catena. Tuttavia se la registrazione dell’evento sonoro non contiene
informazioni sulla localizzazione (per esempio se la ripresa è stata eseguita
con i microfono molto vicini agli strumenti) non c’è diffusore al mondo in
grado di ricostruirla.
Bibliografia
|
Beranek, L. L. |
Acoustics. McGraw-Hill Book Company ISBN 07-004835-5
e ISBN 0-88318-494-X |
1954 |
|
Spagnolo |
Manuale di Acustica Applicata,
UTET |
2001 |
|
F. Alton Everest |
Manuale di acustica. Milano:
Hoepli |
2002 |
|
Beranek, L. L. |
Concert and Opera Houses –
Spinger – seconda edizione ISBN 0-387-95524-0 |
2004 |
|
Cingolati - Spagnolo |
Acustica Musicale e
Architettonica, UTET |
2005 |
|
Sean E. Olive and Floyd E.
Toole National Research Council, Ottawa |
The Detection of Reflections in Typical Rooms |
|
Floyd E. Toole Vice President Harman International Industries, Inc |
Loudspeakers
and Rooms for Multichannel Audio Reproduction (perte 1,2,3 e 4) |
|
Floyd E. Toole, Vice President Harman International Industries, Inc |
The Science of Audio |