Psicoacustica: Falsificare lo spazio – Mirko Perri Sound Blog

Riporto la traduzione di un’articolo di Shaun Farley su designingsound.org che spiega nel dettaglio un’utilissima tecnica di spazializzazione.

Quando si lavora alla spazializzazione del suono, mettere plug-in di riverbero a volte può essere faticoso, in quanto (benché meravigliosi) sono grandi consumatori di DSP. A volte per ricreare un’effetto, anche semplice, risultano essere onerosi in maniera eccessiva per la macchina e possono anche richiedere tanto tempo per la configurazione dei parametri, specie se si tratta di imitare uno spazio aperto. Ho pensato che fosse utile condividere un trucco che uso per risolvere queste problematiche. Un metodo di spazializzazione che incide quasi nulla sui DSP e ci permette di “falsificare lo spazio”. Mi spiego. Non ci accingeremo a emulare un riverbero tradizionale, ma cercheremo di aggiungere un lieve senso di spazializzazione ai i suoni con cui lavoriamo. Andremo ad aggiungere un po di presenza tipica delle piste multicanale per meglio contestualizzarli nel mondo. Prima di addentrarci nella pratica della cosa, ripassiamo un po di scienza!

Le leggi che ci permetteranno quanto detto sono una combinazione di biologia e psicologia, con un pizzico di fisica. Lo studio che si occupa di capire come sentiamo e percepiamo il suono è chiamato Psicoacustica; andremo a dare una rapida occhiata a come si comportano i ritardi audio e come si integrano con la sorgente diretta. Dopotutto, all’orecchio, la riverberazione altro non è che il rapporto tra l’inizio (i primissimi istanti di un evento sonoro) e le riflessioni (l’inizio ritardato) di quell’evento.

Cominciamo a discutere di quello che succede quando ascoltiamo un misto di suoni diretti e suoni riflessi. Ci sono quattro valori relativi al tempo che bisognerebbe ricordare. 10ms, 35ms, 50ms, e 100ms. Meglio se in forma decimale, i numeri che torneranno utili all’interno della DAW sono: 0.010, 0.035, 0.05o, 0.1 secondi.

Cominciamo dai valori significativi per la percezione del riverbero. Con ritardi di 35ms, iniziamo a percepire le riflessioni come un’eco del suono diretto. Questo è quello che in genere di intende come “early-reflection” nei plug-in, e il range che occupano arriva fino a 50ms. 50ms è il momento in cui le seconde riflessioni iniziano e si estendono fino a 100ms. A dire il vero gli echi che percepiamo distintamente si trovano dagli 80ms in poi. Tutto ciò che si muove in questo range può essere considerato eco e ci aiuta ad interpretare lo spazio circostante. Queste riflessioni ci dicono quanto siamo distanti dalla sorgente, quanto è larga la stanza e, a seconda del rapporto tra il suono diretto e quello riflesso, dove si trova la sorgente sonora. E’ la densità e la diffusione di tutte queste riflessioni che trasforma gli echi in riverbero. Le riflessioni diffuse che vanno oltre i 100ms sono ciò che definiscono il decadimento del riverbero caratteristico di uno spazio. Definiamo una stanza con un’acustica “viva” quando c’è molta attività e “asciutta” quando ce n’è poca o nulla.

Quando ascoltiamo un misto di suoni diretti e suoni riflessi accade un particolare fenomeno chiamato filtro comb. Succede soprattutto tra i valori relativi alle prime riflessioni…e in tutto quel range naturalmente…anche se è più evidente quando i ritardi sono piccoli.. Nel range tra 1 e 10ms, il filtro comb è pesantemente evidente. Infatti è proprio in questo range che i plugin di phasing generano il loro caratteristico effetto. Se non intenzionale, è meglio evitare la combinazione di suoni diretti e suoni riflessi in questo lasso di tempo.

Quindi, cosa c’è di così speciale tra 10 e 35ms? Cosa c’è di così speciale in questo range di cui non abbiamo ancora discusso? Bene, qui è dove avviene “l’effetto Haas“. L’effetto Haas, prende il nome dallo scienziato che lo ha identificato, Helmut Haas. E’ il nome che si da al modo in cui si integrano tutte le riflessioni sotto la soglia dei 35ms. [NB: è interessato anche il range 0-10ms, ma lo ignoreremo per via del filtro comb che accade in quel lasso di tempo]. Detto semplicemente, il nostro cervello interpreta tutte le riflessioni e i ritardi sotto i 35ms come parte integrante del suono diretto.

Ora entriamo nel vivo. Esempio, Consideriamo il suono A, che si trova nel canale sinistro. Lo dirigiamo nel canale destro con un ritardo tra 10 e 35ms. Chiamiamo questo ritardo suono B. Quando ascoltiamo A e B contemporaneamente, il nostro cervello interpreterà A come il suono sorgente, anche se B dovesse avere un livello maggiore. E’ così. Nonostante la differenza di livelli potrebbe far credere di ascoltare due suoni discreti panpottati, percepirete un solo suono panpottato.

Naturalmente, ci sono alcuni dettagli che bisogna notare. Teniamo questo discorso da parte per dopo e vediamo un’esempio pratico. Inizio con il suono di un’auto da corsa. Inserisco il suono in Pro Tools, lo assegno totalmente al canale sinistro (come fosse il suono A) e faccio un bounce su una pista stereo. In questo modo ascoltiamo il suono come se fosse una sorgente mono senza riverbero o spazializzazione nel canale destro.

Suono A assegnato a sinistra senza spazializzazione:
[soundcloud url=”http://api.soundcloud.com/tracks/69820621″ params=”” width=” 100%” height=”166″ iframe=”0″ /]

Continuiamo; ho duplicato il file su una seconda traccia (come fosse il suono B). Ho spostato il suono duplicato di 29ms dopo il suono originale e lo abbassato di 12,5dB. Niente uso di DSP.

Suono A duplicato, ritardato e assegnato al canale destro:
[soundcloud url=”http://api.soundcloud.com/tracks/69820628″ params=”” width=” 100%” height=”166″ iframe=”0″ /]

Come prossimo passaggio voglio de-correlare un po il suono per enfatizzare l’illusione. Così ho equalizzato il suono B e ho incrementato il livello fino a -9.5dB.

Suono stereo con EQ:
[soundcloud url=”http://api.soundcloud.com/tracks/69820624″ params=”” width=” 100%” height=”166″ iframe=”true” /]

Questo trucco psicoacustico funziona sia con suoni che si muovono dal canale destro a quello sinistro, sia con un’immagine stereo statica. Di seguito a spostato i canali nelle posizioni opposte. Se provate questa soluzione è importante che il timing tra i due suoni sia identico o quasi. Questa simultaneità aiuta il cervello a integrare i suoni come se fosse uno.

Stereo EQ pan:
[soundcloud url=”http://api.soundcloud.com/tracks/69820626″ params=”” width=” 100%” height=”166″ iframe=”true” /]

E’ giusto per provare che il suono B può essere anche più forte, di seguito si può ascoltare una ripetizione del suono precedente. Questa volta il suono B e a +3dB rispetto ad A. Ciò è in linea con quanto predice la psicoacustica in merito alla fusione dei suoni non ostante le differenze di livello, l’illusione zoppica solo all’inizio del take. Ricordate che il suono dell’auto A si muove da sinistra verso destra, mentre l’auto B da destra verso sinistra.

Stereo EQ pan a favore dell’auto B:
[soundcloud url=”http://api.soundcloud.com/tracks/69820627″ params=”” width=” 100%” height=”166″ iframe=”true” /]

Ho ricreato con successo lo spazio intorno a questa auto, e l’unico DSP che ho usato è relativo all’EQ. Non era neanche necessario, è servito solo a perfezionare l’esperienza. Questa tecnica la uso quando lavoro con dei file mono provenienti dal set, girati in sterno, che devo integrare in una colonna audio multi-canale (stereo o 5.1). Si, l’ho usata con ottimi risultati su mix 5.1. E’ molto utile per far calzare il suono in un’ambiente, utilizzando le caratteristiche dello spazio originale presente sulla registrazione.

Come dicevo prima ci sono dei dettagli da tenere in considerazione:

1. Questa tecnica ha dei limiti e non bisogna lasciarsi confondere. Funziona solo con quello che è presente nella registrazione. Non avrete la possibilità di ricreare spazi enormi o lunghe code di riverbero se non esistono nella registrazione originale.

2. Non ostante la psicoacustica, bisogna stare attenti ai problemi di fase in cui si potrebbe incorrere. Serve cautela. E’ utile sommare i due file in un’ascolto mono per avere la certezza. Mentre si ascolta in mono, provate a mettere alternatamente in solo le tracce e se, quando si sommano, avviene qualche strana colorazione del suono, con molta probabilità avete commesso qualche esagerazione lungo il processo. E’ ugualmente importante verificare l’effetto su un’ascolto che va oltre lo stereo, perché problemi di fase potrebbero diventare evidenti nella distribuzione dei canali dopo un decoding. Se ne avete la possibilità, fate un check con l’audio che passa attraverso un processo di encoding/decoding prima di darlo per buono.

3. Esiste una durata minima che richiede il suono originale, i suoni transiente non sempre funzionano bene. E i suoni che sono composti da transienti ciclici potrebbero funzionare ancora peggio. Per esempio ascoltiamo il suono dello stesso motore al minimo.

[soundcloud url=”http://api.soundcloud.com/tracks/69820622″ params=”” width=” 100%” height=”166″ iframe=”true” /]

Qui, l’auto A e l’auto B erano allo stesso livello. Mentre il canale sinistro, Auto A, sembra più forte e dominante, il canale destro, Auto B, è percepito come se fosse indipendente da A. Per ottenere la sensazione di integrazione fra i due suoni dobbiamo necessariamente anticipare il suono ritardato. Ciò significa anticipare fino alla soglia 1-10ms che, come detto prima, va evitata.

4. Esiste una soglia minima del livello/volume per mantenere l’illusione. In generale, è meglio tenere A in maniera moderatamente più forte di B, se volete sperimentare di seguito una lista di limiti psicoacustici da mantenere:

10ms – B non più di +4dB oltre A
20ms – B non più di+5dB oltre A
30ms – B non più di A (0.0dB)
35ms – B non più di -3.5dB sotto A

[NB: le curve di questi valori non sono lineari e rispondono anche in base al contenuto spettrale, che è anche il motivo lo sbilanciamento che si ha sul file #5 è border-line rispetto a quando è a +3dB]

5. Più vicini si sta ai valori magici 10 e 35ms, più avete la probabilità di fallire con questa tecnica. Per questo motivo tendo a stare almeno 5ms lontano da quei valori. Sperimentate con i valori tra 15ms e 30ms.

Questi sono i cinque punti cardini da tenere in mente quando si utilizza questa tecnica. Ma non prendetemi troppo in parola, sperimentate voi stessi e condividete i risultati, sono sicuro che in qualche modo sarà utile a tutti 😉

Shaun Farley
Designing sound
Traduzione Mirko Perri

viagra

Mirko Perri

Lascia un commento Annulla risposta