Speciale
Voce
Scrivere, ricordare, ragionare, rispondere, mostrare, interagire, suggerire, elaborare, persino confortare... Ascoltare? Parlare?
Le funzioni dell'IA generativa che più colpiscono la nostra immaginazione (di conseguenza, quelle che più fanno notizia) hanno tutte a che fare con l'emulazione di prestazioni umane ed è abbastanza comprensibile che sia così. Siamo più coinvolti dove è possibile un paragone, un confronto diretto con noi stessi. Da questo punto di vista non va certo sottovalutato il recente rilancio degli assistenti vocali, ora potenziati con l'AI generativa. L'importanza della voce non fu affatto sottovalutata né dai produttori del film Her (2013) che scelsero la star Scarlett Johansson per dare voce a Samantha, il sistema operativo di cui si innamora il protagonista del film. In una sorta di profezia autoavverantesi, nel 2024 OpenAI ha chiesto alla stessa Johansson di fornire la sua voce al sistema di ChatGPT proprio per marcarne l'analogia con i servizi di assistenza virtuale attraverso il riferimento al film (ne è seguita una controversia poiché l'attrice accusò la società di aver impiegato una voce troppo simile alla sua, dopo che lei aveva rifiutato l'idea di prestarla).
La supremazia che accordiamo alla vista è ottimamente motivata ma ciò non deve portarci a trascurare l'apporto, e da certi punti di vista persino il primato, della voce. Primato cronologico, innanzitutto. Quando, come si dice, "veniamo alla luce" non vediamo ancora se non confusamente ma strilliamo già pienamente e soprattutto abbiamo ascoltato da mesi. La voce della madre ci è arrivata oltretutto per vie interne, come in un ascolto tattile, suono di cui il nostro stesso corpo prenatale è stato cassa di risonanza oltre che organo auditivo.
Un altro primato della voce riguarda non la sua registrazione (la fotografia precede la fonografia, sia pure di poco) ma la sua trasmissibilità a distanza: la radio prima della tv, il telefono prima delle videochiamate, le chat telefoniche prima di quelle in Rete.
Precoci sono state anche le truffe. Ora si sono odiosamente specializzate contro gli anziani, come nella storia già ripresa da MagIA della signora di Treviso, truffata per 30 mila euro da una banda che ha sfruttato l’IA per clonare la voce della figlia. Ci possiamo immedesimare poiché sappiamo molto bene cosa sia la voce anche solo telefonica di una persona carissima e che calore emani il suo richiamo, soprattutto con l'avanzare dell'età. Ma anche senza un richiamo affettivo tanto potente colpisce la storia di Massimo Moratti e degli altri imprenditori convinti a versamenti milionari da un interlocutore telefonico che si presentava come il ministro della Difesa Guido Crosetto: anche qui si può sospettare che l'imitazione della voce fosse particolarmente convincente grazie a qualche dispositivo. Moratti ha poi commentato: “Questi sono bravi, nel senso che sembrava assolutamente tutto vero. Comunque può capitare, poi certo uno non se l’aspetta una roba di questo genere. Ma succede a tutti...”.
Aspetto tecnologico a parte anche tralasciando l'aspetto degli scherzi telefonici, il passato ci ha offerto casi interessanti sino al clamore. Uno dei nomi più sorprendenti nella lista pubblicata degli iscritti alla loggia massonica segreta P2 fu quello di Alighiero Noschese, star della paleoTV e imitatore sopraffino. Si disse in seguito che il Maestro Venerabile Licio Gelli avesse convinto Noschese ad aiutare i tenebrosi disegni piduisti imitando voci di politici influenti per ingannare interlocutori telefonici (a fini certamente non burleschi). E anni dopo, per giustificare intercettazioni telefoniche imbarazzanti, Silvio Berlusconi affermò che notoriamente al telefono si hanno conversazioni fiabesche, oniriche, non collegate alla realtà... Notoriamente? Chissà: ma la voce ha una capacità suggestiva appunto non trascurabile. Tanto che una grande suggestione può averla anche la mancanza di voce, cioè il silenzio.

La leggenda dice che Michelangelo Buonarroti, finito di scolpire il suo Mosè, fu talmente compiaciuto dell'eccezionale realismo della figura da colpire con il martello il ginocchio marmoreo domandando con stizza: "Perché non parli?". Il ginocchio è peraltro proprio la parte del corpo su cui si verifica il riflesso condizionato ma non è detto che Buonarroti pensasse a quello: né che fosse consapevole del confine acustico che la sua domanda tracciava tra umano e non umano. La vista poteva essere ingannata, ma l'udito no. Il proprio dell'essere umano non è nelle sue fattezze esteriori, poiché il corpo può essere modellato anche in argilla o marmo. Il proprio è la voce, poiché nessun altro essere la sa riprodurre – fuori dall'emulazione sgraziata del pappagallo. Homo Loquens, e anzi Homo Vocans, fu proprio Mosè dovette rispondere all'appello divino emesso dal roveto ardente. Nella Divina Commedia poi avranno voce alberi, spiriti, fiammelle, esseri mostruosi, a ricordarne l'origine umana prima della metamorfosi imposta alle diverse persone dal loro rispettivo destino ultraterreno. E, in una diversa prospettiva metafisica, prima di ogni altra cosa Pinocchio è voce e come voce manifesta la sua problematica ontologia. Nel capolavoro di Stanley Kubrick, di Hal 9000 è in vista soltanto una luce quasi (o pseudo-) pupillare e sentiamo la voce: la luce marca la differenza con gli esseri umani, la voce la profonda analogia. Nell'ultima interazione live di tutta la storia là raccontata fra uomini, questi si appartano dove Hal 9000 può vederli ma non può sentire la loro voce, tuttavia Hal ne coglierà le intenzioni grazie alla labiolettura. E quando l'Intelligenza Artificiale verrà finalmente disattivata il suo venir meno giungerà all'astronauta (e agli spettatori) come voce regredita all'infanzia che declama a stento una filastrocca.
L'emulazione sintetica arriverà a riprodurre anche quella che Roland Barthes chiamava "la grana della voce"? La nostra voce non rende udibili soltanto le parole, per come potrebbero essere scritte: aggiunge loro accenti, toni, inflessioni, esitazioni, errori, lapsus del tutto congruenti con la connotazione di manchevolezza, fallibilità, imperfezione che segna la nostra idea di umanità. Anche per questo possiamo dire che la voce marca un confine dell'umano. La suggestione della sua presenza ha prodotto accezioni svariate del suo nome, della cui gamma incuriosisce soprattutto l'ampiezza dello spettro che va da "voce" come lemma, descrizione vocabolariale, quindi anche tentativo di rigore formale applicato al linguaggio a "voce" come discorso vagante, incontrollabile, impersonale, pettegolo, potenzialmente maligno.
Soprattutto però la voce è legata al corpo da cui scaturisce: il corpo è visibile perché ha una massa che occupa lo spazio; la voce può diffondersi perché ha un corpo che la emette. Cosa sarà mai, dunque, una voce incorporea? Nella sua declinazione tecnologica qualcuno se lo sarà chiesto già ai tempi della Voce umana di Jean Cocteau (pièce teatrale, 1930), dell'Ultimo nastro di Krapp di Samuel Beckett (pièce teatrale, 1958), della Vita corre sul filo di Sidney Pollack (film, 1965), dei servizi telefonici, come Telefono Amico, sino alle chat erotiche che annunciarono il cybersex, come in Vox, romanzo erotico telefonico di Nicholson Baker (1992). È tanto più urgente chiederselo ora che la potenza dell'intelligenza estesa generativa si dispiegherà a piena voce, sia pure senza polmoni. Dovremo presto tener conto che un confine verrà definitivamente attraversato: appunto il perimetro dell'umano sinora tracciato dalla voce. Non perché il rapporto tra voce e corpo venga meno ma perché ne viene meno la già precaria condizione esclusiva.
Quella che ha fatto scrivere a Italo Calvino che "La voce viene certamente da una persona, unica, irripetibile, come ogni persona [...] una persona viva, gola, torace, sentimenti, che spinge nell'aria questa voce diversa da tutte le altre voci" ("Un re in ascolto", racconto, 1983).
Quella che ha fatto dire alla filosofa Adriana Cavarero che "L'inerenza della voce al corpo umano è tale che il corpo stesso può essere immaginato come suo strumento" ("Voce. Una definizione filosofica"; in Il corpo della voce. Carmelo Bene, Cathy Berberian, Demetrio Stratos, Palazzo delle Esposizioni, 2019).
Non che sia altro che una curiosità, ma un anagramma del cognome Cavarero è: voce rara. Chissà se l'AI lo saprà mai.
Prompt, Chi parla? Voci raccolte da Stefano Bartezzaghi, speciale in collaborazione con MAgIA, Magazine Intelligenza Artificiale. Leggi la rivista qui.
Leggi anche:
Stefano Bartezzaghi | Falso
Stefano Bartezzaghi | Mistificazione
Stefano Bartezzaghi | Evidenza
