Libri / Tecnologia

Il sapere digitale

23 Maggio 2024

Se passeggiando sulla spiaggia ti imbatti in un oggetto complesso, probabilmente penserai che non si sia creato da solo – per caso – ma che esso sia opera di un artigiano intelligente che basandosi su un progetto abbia messo insieme le sue varie parti. Per analogia, di fronte alla complessità del mondo in cui viviamo, e in particolare alla perfezione funzionale degli innumerevoli esseri viventi, siamo spinti a credere che tale meraviglia non possa essersi creata da sola, ma debba essere il frutto di un intelligente creatore onnipotente. Questo ragionamento è servito per secoli a fornire la prova più semplice e convincente dell’esistenza di Dio. Almeno fino a quando – eliminando l’inspiegato deus ex machina – Darwin non ha mostrato come l’infinita varietà delle specie viventi possa essere generata da un cieco processo di riproduzione (non sempre identica) e di selezione.

Gino Roncaglia, nel suo ultimo libro L’architetto e l’oracolo (Laterza, 2023), recentemente pubblicato da Laterza, sembra trasferire questo dualismo esplicativo a quello che viene considerato l’ultimo e più elevato gradino dell’evoluzione: l’intelligenza umana. In verità – un po’ per onere professionale (è infatti professore di editoria digitale e digital humanities presso l’Università Roma Tre), un po’ per la sua assidua esplorazione della rete – Roncaglia concentra la sua attenzione sull’organizzazione di alcuni prodotti più recenti dell’intelligenza umana e cioè le enciclopedie digitali, il web semantico, l’intelligenza artificiale generativa, la conservazione digitale delle memorie individuali e collettive; ma qua e là si lascia andare a considerazioni – appena accennate, essendo ben consapevole dell’enormità e difficoltà della questione – sulle implicazioni che l’analisi delle strutture organizzative di questi ampi repertori della conoscenza possa avere sulla struttura organizzativa della mente umana.

Le ampie strutture della conoscenza di cui si occupa sono presentate come “cattedrali digitali” nella suggestiva proposta di periodizzazione dello sviluppo della rete formulata nel suo libro precedente, L’età della frammentazione, e in questo brevemente riproposta. Come l’umanità per raggiungere l’età medioevale del commercio e delle cattedrali ha dovuto attraversare prima un periodo di caccia e raccolta, con scarse risorse e relazioni; poi quello della sedentarizzazione con l’agricoltura e la proprietà privata; e infine uno dell’artigianato; così i primi esploratori della rete, dotati di lentissimi collegamenti all’inizio andavano alla ricerca degli scarsi contenuti esistenti, che venivano consumati nelle caverne dei loro PC una volta disconnessi; ma poi è arrivata la sedentarizzazione del web, con i siti e una maggiore abbondanza di contenuti, che erano però ancora statici, proprietari e difficilmente rielaborabili; infine è giunta l’era degli aggregatori di contenuti e della loro rapida fluidità, dei social network. Ora forse siamo pronti a costruire ampi e complessi repertori del sapere, poiché la brevità, granularità e frammentazione della maggior parte dei contenuti oggi disponibili non costituisce una caratteristica intrinseca del digitale. E, tra le ampie strutture della conoscenza, le enciclopedie hanno da sempre rappresentato la forma più alta.

La migrazione delle enciclopedie dalla carta al digitale è stata particolarmente fortunata perché la loro modalità di consultazione occasionale e puntuale piuttosto che lineare costituisce un perfetto connubio di granularità e complessità; e anche perché si è aperta la possibilità di aggiungere informazioni non testuali e continuamente aggiornabili. Ma tale migrazione non è stata istantanea e nella prima sezione del suo libro Roncaglia traccia una rapida ma densa descrizione di tale processo individuando fasi analoghe a quelle dell’evoluzione generale dell’ecosistema digitale.

Poiché le enciclopedie – sia cartacee sia digitali – presentano il sapere in strutture rigidamente organizzate, basate su ontologie e gerarchie ben fondate grazie ad un attento studio preliminare, possiamo ritenerle l’esempio paradigmatico di un modello organizzativo del sapere frutto del lavoro del primo personaggio del titolo del libro: l’architetto.

Ma quando arriviamo ad analizzare i motivi del buon funzionamento della più popolare enciclopedia in rete, e cioè Wikipedia, intravediamo l’emergenza di nuovi principi organizzativi non assimilabili a quelli usati dall’architetto. Il buon funzionamento di Wikipedia si deve infatti, non solo all’attenta strutturazione preliminare, ma anche alla collaborazione, a volte anche conflittuale, di innumerevoli interventi di autori non necessariamente autorevoli che negoziando liberamente producono – in modo abbastanza stupefacente – un sapere affidabile: la selezione delle revisioni produce la sopravvivenza delle definizioni migliori! E più revisioni si confrontano, migliore è il risultato.

Questa modalità di organizzazione del sapere, più oscura e diversa da quella dell’architetto, la ritroviamo in modo ancora più evidente nel funzionamento delle intelligenze artificiali generative di cui Roncaglia si occupa nella seconda sezione del suo libro. Come prima cosa ci viene presentata una sommaria ma chiara descrizione del loro funzionamento. Ci viene spiegato quali sono state le prime reti neurali, qual è la differenza tra IA discriminative e generative, quali sono i passi fondamentali per costruire una IA generativa, come esse divorano quantità enormi di informazioni nel corso del loro addestramento, ma anche cosa sono i token, l’apprendimento non supervisionato e supervisionato, i trasformer, i bias, ecc.. Tra parentesi, è interessante notare come gli autori di provenienza umanistica dedicano spesso più attenzione agli aspetti tecnici di quelli di provenienza scientifica. O almeno questo è quello che avviene sempre negli scritti del nostro autore. L’organizzazione delle IA generative si distacca da quella rigida, sistematica, deterministica realizzata dall’architetto perché non abbiamo una chiara conoscenza dei livelli intermedi delle reti, non sappiamo perché i nodi assumono determinati valori nel corso dell’addestramento, non riusciamo a far corrispondere i nostri concetti sintattici e semantici a ben individuate strutture della rete, perché le associazioni che vengono stabilite sono solo statistiche-probabilistiche.

Sembrerebbe che ora al lavoro ci sia qualcun altro, qualcuno che non ci vuole rivelare il suo metodo per arrivare alle conclusioni o che forse addirittura non possiede alcun metodo, qualcuno che possiamo paragonare al secondo personaggio del titolo: l’oracolo.

Questo modello organizzativo sembra più organico, vivente, capace di modificarsi e crescere in forme non sempre ben definite e comprensibili. Inoltre, le IA generative di ultima generazione come ChatGPT 4 hanno raggiunto delle competenze linguistiche talmente sorprendenti da suggerire un vero e proprio salto qualitativo su cui è necessario interrogarsi. E, come prima cosa, bisogna evitare l’errore – sostiene Roncaglia – di ritenere questi modelli di linguaggio di ampie dimensioni o LLM (Large Language Models) dei semplici “pappagalli stocastici” poiché non si limitano a ripetere meccanicamente frammenti di testo su cui stati addestrati ma producono i loro output in modo in parte oscuro e in un certo senso creativo.

Ci si potrebbe chiedere come mai proprio ora è emerso con forza questo modello oracolare del sapere, che cosa lo ha reso possibile. Roncaglia sembra avere le idee chiare su questo, tanto è vero che apre il suo libro con tre citazione che sottolineano tutte e tre l’aspetto quantitativo del sapere, anche se poi nel corso del libro non sottolinea più come sia proprio la crescita enorme della velocità di elaborazione dei processori e delle comunicazioni di rete, ma soprattutto l’enorme quantità di informazioni codificate in formato digitale facilmente disponibile a permettere l’implementazione del nuovo modello di intelligenza oracolare. Possiamo di nuovo ricorrere ad un’analogia con l’evoluzione biologica. Come la grande ossidazione (cioè l’accumulo di enormi quantità di ossigeno nell’atmosfera terreste che prima ne era quasi completamente sprovvista) avvenuta circa due miliardi e mezzo di anni fa (probabilmente grazia all’azione dei cianobatteri) ha prodotto un enorme salto evolutivo permettendo lo sviluppo di organismi pluricellulari dotati di grande energia poiché metabolizzano l’ossigeno; così l’enorme disponibilità di informazione in formato digitale facilmente accessibile sta permettendo lo sviluppo di modalità di organizzazione della conoscenza nuove rispetto al passato. Un cambiamento radicale nell’ecosistema produce l’apertura di nuove possibilità precedentemente non previste!

Ma la questione fondamentale che tutti si chiedono è: il funzionamento di queste ultime forme di IA può essere assimilato a quello della mente umana? La maggioranza di coloro che sono intervenuti nel dibattito tende a sottolineare la differenza tra IA generative e produzione linguistica umana, spesso per motivi validi ma non insuperabili in un prossimo futuro (le IA generative sono inaffidabili, soggette a pregiudizi, troppo dipendenti dai corpora su cui sono addestrati, prive di semantica perché prive di corpo, ecc.), altre volte invece per motivi essenziali (la produzione linguistica umana non nasce da una pura competizione tra parole, da criteri statistici probabilistici, e rimanda chiaramente ad un architetto che presiede alla costruzione delle frasi). Il difetto principale di queste ultime tesi è che si basano su una presunta conoscenza della mente umana, cosa che ancora ci sfugge. Per quanto inverosimile possa sembrare, siamo sicuri che anche nella nostra produzione linguistica non ci sia spazio per meccanismi di produzione di tipo statistico-probabilistico? Siamo sicuri che dentro di noi ci sia sempre un architetto cosciente che mette in fila le nostre parole? Se intendiamo l’IA come psicologia allora possiamo negare che ci fornisca una fedele descrizione del funzionamento della mente umana, ma se la l’intendiamo come ingegneria non possiamo negare che produca un comportamento linguistico intelligente. E la disponibilità di un artefatto in grado di produrre un comportamento linguistico intelligente delimita un lato del campo delle possibilità funzionali all’interno del quale si trovano sia l’intelligenza artificiale sia quella naturale.

La terza sezione del libro si occupa delle memorie personali in formato digitale, delle loro diverse tipologie e della storia del loro passaggio dall’analogico al digitale. La possibilità di esternalizzare la nostra memoria fissandola su vari supporti – argilla, pergamena, carta, ecc. – è una modalità di funzionamento della nostra mente talmente antica e diffusa che alcuni filosofi hanno recentemente sostenuto la teoria della mente estesa, e cioè che la mente umana non si limiti alla sua naturale sede biologica – e cioè il cervello – ma comprenda anche tutti i supporti di cui si serve per il suo funzionamento. Senza entrare nel dibattito sulla correttezza o meno di questa tesi, il nostro autore ci ricorda come la rivoluzione digitale sia stata anche una rivoluzione della memoria, perché oggi – volenti o nolenti – affidiamo a vari supporti digitali gran parte di ciò che affidavamo ai nostri neuroni e perché lasciamo tracce digitali di noi stessi incomparabilmente superiori a quelle analogiche del passato. Ciò apre anche nuove interessanti (e inquietanti) prospettive, per esempio quella di ibridare i temi della seconda sezione del libro con quelli della terza, e cioè di addestrare una IA generativa sul corpus di memorie personali di un individuo affinché sia in grado di riprodurre il suo comportamento linguistico, e quindi aver un gemello digitale di noi stessi (o per lo meno un qualcosa/qualcuno in gradi di esprimersi in modo estremamente simile a quello che noi faremmo nelle stesse circostanze).

Nella quarta ed ultima sezione, Roncaglia ci invita ad una breve esplorazione nel campo della letteratura fantascientifica – una sua antica e dichiarata passione – per verificare se anche al suo interno sia possibile rintracciare esempi di ciò che ha chiamato modello architettonico o oracolare del sapere. Innanzitutto, osserva come il tema dell’organizzazione e conservazione del sapere sia un tema spesso visitato dalla fantascienza, e come sia interessante riflettere sul modo in cui i vari autori abbiano immaginato le biblioteche e le enciclopedie del futuro. Ci ricorda il ruolo fondamentale che l’Enciclopedia Galattica e la biblioteca di Trantor svolgono nel passaggio dal primo al secondo impero galattico nel ciclo della Fondazione di Asimov. Queste “cattedrali del sapere” hanno un’organizzazione del sapere chiaramente architettonica, mentre appaiano molto più simili alle attuali Intelligenze Artificiali generative – e quindi al modello oracolare – le bibliotecarie e i bibliotecari (ovviamente virtuali) presenti nel romanzo distopico Snow Crash di Stephenson oppure in quello di Ted e Bob Rockwell, The Virtual Librarian. A Tale of Alternative Realities.

Se continuiamo a tenere vivo questo spazio è grazie a te. Anche un solo euro per noi significa molto. Torna presto a leggerci e SOSTIENI DOPPIOZERO