Audio binaurale nei videogiochi: cos'è e come funziona

Siamo vicini alla nuova generazione di console, e anche il sound design meriterebbe orizzonti inediti. L'audio binaurale è il futuro dei videogiochi?

speciale Audio binaurale nei videogiochi: cos'è e come funziona
Articolo a cura di

Abbiamo ormai imboccato il viale del tramonto dell'attuale generazione di console, quello che di qui al prossimo inverno ci condurrà a muovere i primi passi nel futuro prossimo del medium. E mentre i principali attori del mercato hanno già cominciato a misurarsi - almeno dietro le quinte - a colpi di Teraflops e possanza poligonale, oggi vogliamo dedicare un approfondimento a uno dei giganti silenziosi dell'artigianato videoludico: il comparto sonoro. Sappiamo infatti che un sound design di qualità può spesso rivelarsi cruciale per la godibilità di un'esperienza digitale (ne abbiamo parlato nel nostro speciale sul sound design), e l'audio binaurale sembra rappresentare la nuova frontiera di questo particolare aspetto della produzione videoludica. Ma è davvero così? E, soprattutto,che diamine è l'audio binaurale?
Ecco, parliamone un attimo.

L'anatomia del suono

Per capire fino in fondo cosa si intende per audio binaurale, e perché si tratta di una risorsa preziosa quando si tratta di amplificare l'immersività di un'esperienza videoludica, è necessario spendere qualche parola sul funzionamento del nostro udito, sulle dinamiche che ci permettono di identificare - con sorprendente precisione - il punto di origine di un determinato suono.

La nostra capacità di localizzare un suono è la conseguenza di due meccanismi ben precisi, il ritardo interaurale e la differenza d'intensità interaurale, cui contribuisce un terzo elemento legato alle specifiche anatomiche del nostro orecchio esterno. Quando intercettiamo un rumore a bassa frequenza (compreso tra 20 e 2000 Hz), il brevissimo lasso di tempo che separa l'arrivo dell'impulso sonoro da un orecchio all'altro, diretta conseguenza delle meccaniche di propagazione del suono, ci permette di capire al volo quale sia la sua direzione. In parole povere, se l'origine del rumore è più vicino all'orecchio sinistro, il nostro cervello ci suggerirà che la sua fonte si trova alla nostra sinistra, e viceversa.

Per i suoni ad alta frequenza (tra 2000 e 20000 HZ) si usa un meccanismo simile, ma con una differenza sostanziale: in questo caso la discriminante non è il tempo ma l'intensità. Visto che la testa rappresenta un ostacolo alla diffusione del suono, un impulso sonoro proveniente da destra raggiungerà l'orecchio sinistro con un'intensità ridotta rispetto a quella percepita dallo speculare, permettendoci di identificarne il direzionamento.

Entrambi i metodi si dimostrano però inefficaci quando si tratta di capire se l'origine di un suono si trova davanti a noi o alle nostre spalle, visto che i meccanismi sopraccitati tendono a generale risultati sovrapponibili quando entra in ballo questa variabile. In linea con il dogma anatomico "la funziona giustifica la forma", la struttura del nostro orecchio esterno arriva quindi a offrire al nostro lobo temporale informazioni aggiuntive utili a chiarire questa incertezza.

La "pinna", composta principalmente da cartilagine fibrosa, è infatti un insieme di creste a avvallamenti che, a contatto con le onde sonore, riflettono il suono generando anomalie che cambiano significativamente a seconda della traiettoria dell'impulso, e vengono elaborate con l'ausilio della memoria. Il risultato di questa complessa serie di processi, che avvengono nel giro di un istante, è una percezione direzionale piuttosto accurata. Svelati i misteri del nostro sistema uditivo, la domanda è ora la seguente: com'è possibile ingannare i sensi con un'esperienza artificiale? La risposta è in realtà piuttosto semplice.

Dai sussurri su Twitch alla voce della psicosi

Girovagando tra i canali di Twitch, negli ultimi anni potreste aver notato una repentina proliferazione dei canali dedicati ai contenuti ASMR, esperienze sonore generate - nella maggioranza dei casi - utilizzando particolari dispositivi di registrazione che simulano le percezioni dell'orecchio umano. Si tratta di microfoni binaurali, di base gli stessi utilizzati nello sviluppo videoludico per la creazione di comparti sonori con la stessa denominazione.

Per ottenere in studio una registrazione audio bineurale, a questi apparecchi viene aggiunta una "dummy head", ovvero una testa di manichino costruita con materiali dotati di specifiche proprietà acustiche, e per questo in grado di replicare fedelmente la gamma delle interferenze causate dalla nostra struttura anatomica. Se in passato l'audio 3D veniva realizzato per la gran parte con interventi di post produzione, collocare questo tipo di strumento al centro di una stanza permette ai sound designer di registrare delle tracce audio a cui il cervello del giocatore, anche in assenza di interventi successivi, è in grado di attribuire una direzionalità.

Va da sé che questa tecnologia non esclude che l'audio sia poi rielaborato o migliorato, ma questo metodo si dimostra decisamente migliore nel trasmettere all'utente, con precisione ed efficacia, la sensazione di trovarsi all'interno di un contesto sensoriale realistico.

Da giocatori sappiamo quanto questa sensazione possa rivelarsi fondamentale ai fini dell'immersione in un mondo digitale, a maggior ragione quando ci si trova alle prese con titoli che puntano a suscitare una risposta istintiva nei fruitori (come in horror del calibro di Resident Evil 7), o che utilizzano l'audio come strumento di gameplay (ad esempio quando Modern Warfare il suono di una raffica permette di identificare la posizione di un nemico). La crescita qualitativa delle produzioni in realtà virtuale appare poi indissolubilmente legata a questa particolare tecnologia, che si rivela preziosa nel sostenere quel "senso di presenza" che spesso fa la differenza tra un buon titolo VR e uno tutt'altro che entusiasmante. Proprio di recente, titoli come Resident Evil 2 Remake o Hellblade: Senua's Sacrifice hanno concretamente dimostrato quanto l'audio binaurale possa contribuire al bilancio qualitativo di un'esperienza videoludica: il costante bisbiglio delle voci nella testa della guerriera pitta, così come il terrificante suono dei passi di Mr X nelle sale della stazione di polizia di Raccoon City, ha lasciato una traccia indelebile nella memoria del pubblico, favorendo la diffusione di un concetto tecnologico precedentemente ignoto ai più. Una considerazione che ci conduce direttamente alla seconda domanda di questo articolo: ma se l'audio binaurale rappresenta un miglioramento così netto rispetto ai metodi standard, perché la sua diffusione è così limitata?

Non sempre il gioco vale la candela

Partiamo da un presupposto scontato ma essenziale: l'utilizzo dell'audio binaurale non è sempre la soluzione più adatta alle esigenze creative di una produzione. Un team al lavoro su un metroidvania bidimensionale, come intuibile, non trarrebbe alcun vantaggio dall'utilizzo di un sistema sonoro 3D, a meno di non introdurre nella formula di gioco elementi originali e meccaniche esplicitamente legate a questa tecnologia.

Anche uscendo dai confini delle due dimensioni, non è per niente detto che l'audio binaurale contribuisca efficacemente al raggiungimento degli obiettivi del game design, come nel caso di giochi di ruolo dotati di un maestoso comparto narrativo e caratteristiche ludiche che renderebbero l'aggiunta sostanzialmente inutile.

Messo da parte l'ovvio, dobbiamo poi considerare che il carico di lavoro e i costi produttivi imposti dall'implementazione di questa di tecnica potrebbero dimostrarsi proibitivi o, alternativamente, non giustificare appieno un investimento di risorse. Anche perché l'audio binaurale, per sua natura, è adatto esclusivamente alle configurazioni stereo, e offre vantaggi concreti solo utilizzando un paio di cuffie. Circostanze che potrebbero limitare fortemente la fruizione del comparto sonoro per come è stato concepito, visto che tanto i sistemi surround (fisici o simulati) quanto le casse di un TV, per quanto pregevoli siano, non sono pensate per supportare questo tipo di esperienza.

Considerando che a non tutti piace giocare con un headset in testa, e tenendo a mente gli investimenti richiesti dalla tecnologia, è dunque facile capire come l'audio bineurale sia considerato una componente da valutare caso per caso, a maggior ragione visto che gli sviluppatori sono comunque "costretti" a fornire all'utenza opzioni più tradizionali. Resta il fatto che parliamo di una delle frontiere più stimolanti dell'avvenire tecnologico del medium, e non vediamo l'ora di scoprire come questa contribuirà all'orizzonte sensoriale della prossima generazione.