Può un’Intelligenza Artificiale fare cinema?

Gli ultimi mesi hanno visto l’Intelligenza Artificiale come protagonista indiscussa del zeitgeist tecnologico. Strumenti rivoluzionari come chatGPT o Stable Diffusion sono già diventati di uso comune per molti utenti del Web, come se fossero esistiti da sempre. In un clima del genere, scongiurando la possibilità di “AI winters”, possiamo affermare con buona sicurezza che il 2023 sarà un anno di continue novità in materia.

Le sopra citate tecnologie di text-generation e di text-to-image hanno inevitabilmente portato risultati concreti anche in campo creativo/artistico con una pletora di reazioni che variano dal pessimismo eccessivo all’ottimismo infantile. Dai racconti ai quadri digitali, progressivamente si sta provando a mettere l’IA un po’ovunque.

In un contesto del genere quali reazioni potrà mai ricevere la notizia di qualcuno che ha appena prodotto un film scritto da un’IA? Lungi da me iniziare una discussione etica sull’utilizzo di queste tecnologie, vorrei limitarmi a condividere il processo e la gioia della creazione che ho potuto vivere con questo mio piccolo, ma grande esperimento.

Il Diario di Sisifo è il primo lungometraggio al mondo ad essere stato interamente scritto da un’IA. Diverse produzioni di durata molto inferiore lo hanno preceduto; basti pensare al cortometraggio statunitense Sunspring (scritto da un rudimentale LSTM) o alla stessa trilogia di corti sperimentali che hanno portato alla realizzazione del lungometraggio (Frammenti di Anime Meccaniche, La Parvenza delle Onde e Fehlleistung), scritti rispettivamente dai modelli avanzati GPT2 e GPT-J, ma nessuno, fino ad oggi, si è cimentato nella produzione di una narrativa estesa.

Il primato (italiano) del lungometraggio si spiega con l’incredibile fiducia delle persone che hanno accettato di dare il loro supporto alla produzione e una buona dose di felici coincidenze, le quali hanno permesso la riuscita di questo singolare progetto che ho avuto la fortuna di seguire.

“Scrivere a macchina”, sebbene sorprendente a primo impatto, presto si rivela meno rivoluzionario di quanto dichiarato dai più ingenui sostenitori. Informazioni sbagliate, incoerenza e contraddizioni restano esperienza comune anche nei modelli più avanzati come chatGPT.

Un anno fa, ovvero quando è stato generato il copione del film, erano limiti intrinseci e onnipresenti ed è proprio da questi limiti che è partito il metodico lavoro di prompt engineering, ovvero la pratica di veicolare i modelli di IA verso output precisi, con il fine di ottenere la miglior sceneggiatura possibile. Partendo dall’imposizione di alcune condizioni iniziali (budget, location e attori a disposizione) viene chiesto al modello GPT-NeoX di produrre una primissima “sinossi breve”, e il risultato è incredibilmente preciso:

Dissatisfied with his life, a young university student begins to travel around his country looking for meaning and purpose […]

Estratto della prima sinossi generata da GPT-NeoX

Vengono prodotti altri output per esplorare diverse opzioni ma la storia che pare consigliare GPT-NEO è un road-trip movie esistenziale, per certi versi affine ad “Into the Wild” di Sean Penn.

For the first time in the role of screenwriter, an AI narrates the life of Adam, a young university student afflicted by an existential crisis, and his journey towards the meaning of life, between absurd encounters and very human atmospheres.

La logline ufficiale del film

Segue la prima vera fase di scrittura generativa: viene fornita la sinossi appena scelta e l’istruzione di generare partendo da quest’ultima una lista di scene, ciascuna affiancata dalla propria descrizione. Alla riuscita di un film che non fosse tempestato di sperimentalismi e ritmi impropri, questo processo iterativo ha richiesto un, seppur marginale, primo arbitraggio umano. Si è quindi reso necessario troncare la generazione delle scene ogni qualvolta una di queste due condizioni non fosse più rispettata:

continuità: la scena appena generata è in netto contrasto con le scene precedenti o la sinossi;
realizzabilità: la scena appena generata non è realizzabile con i mezzi della produzione;

Tali condizioni, discutibili qualora si volesse sostenere la totale autonomia del processo, restano linee guida irremovibili anche dei più grandi scrittori umani.

Scenes:
1)Adam is writing in his diary while drinking a cappuccino at a bar. His friend John joins him and they talk about his mental health. John suggests that Adam should go out with his friend Eve and see what happens.

2) …

Estratto dalla lista di scene generata da GPT-NeoX

Il risultato finale è una sequenza di appena 22 scene di ritmo diverso, con una pletora di personaggi allo stesso tempo sia originali che stereotipati. Il numero ridotto di scene viene risolto dalla presenza di riassunti di macro sequenze, ovvero di scene la cui descrizione prevede un montaggio molto più lungo di una scena tradizionale. Saranno proprio queste ultime a generare i maggiori problemi dell’interpretazione registica.

Conclusa la generazione di questa pseudo-plotline inizia la fase di generazione della sceneggiatura vera e propria, con azioni, transizioni e dialoghi. Fase che, a mio parere, è stata decisamente la migliore, in termini di coerenza e originalità generativa: questo risultato è quasi sicuramente dovuto all’imposizione del rispetto delle unità aristoteliche di tempo, di spazio e di azione.

Fornendo GPT-NeoX nuovamente di sinossi, plotline e delle scene specifiche di cui generare la sceneggiatura si è velocemente prodotto tutto il copione, con una sensibilità nei dialoghi a dir poco terrificante:

MARK: The further you travel, the better chance you have of not coming back.
ADAM: That’s a pretty depressing perspective.
MARK: It’s the truth.ADAM: Yeah, well that’s certainly a great attitude to have.
MARK: It’s better to have it than not. Everytime I look to the future, the only thing that comes to my mind is this: will I be able to do all the things I want to do, or will I have to leave it all behind?

Estratto di dialogo generato da GPT-NeoX

Non c’è dubbio che il prodotto finale, una sceneggiatura di appena 60 pagine, se analizzato con spirito critico mostra molteplici limiti creativi e qualche errore tecnico. Infatti all’interno della narrazione generata da GPT-NEO si susseguono notevoli cliché: dopotutto, stiamo comunque parlando di una sceneggiatura scritta da un algoritmo, tra l’altro già obsoleto. Sfortunatamente, come testimoniato dagli estratti, la generazione della sceneggiatura madre de Il Diario di Sisifo è stata effettuata totalmente in inglese con una conseguente traduzione in lingua italiana (sempre per mezzo di sistemi di traduzione automatica a base di machine learning, eventualmente corredati da un controllo umano finale). La scelta obbligata è dipesa dalla non esistenza (allora) di modelli di IA in lingua italiana sufficientemente capaci nella generazione di contenuti. Tale squilibrio verso modelli anglofoni resta tuttora un limite profondo nella globalizzazione linguistica dei prodotti a base di IA.

Si è anticipato precedentemente il problema dell’interpretazione registica del testo generato. Infatti, una volta appreso il metodo di generazione corretto, si potrebbe pensare che far scrivere la sceneggiatura all’IA sia la parte più facile mentre avrebbe richiesto fatica rispettarla nei minimi dettagli.

Che libertà prendersi? Come interpretare passaggi dubbi o imprecisi?

Poiché il testo è l’unica cosa a disposizione, il lavoro della regia, certamente nei limiti dell’estetica personale, è stato quello di proporre un’interpretazione quanto più fedele all’idea originale. Impegno che, prevedibilmente, ha richiesto spesso decisioni arbitrarie o compromessi. Mi sento costretto a sostenere che nel processo di traduzione cinematografica la mia sensibilità registica abbia dovuto fare i conti con delle immagini e una direzione ben precisa, imposta dal testo stesso. Sebbene l’opera sia inequivocabilmente passata attraverso il mio filtro cinematografico personale, essa resta il risultato di un dialogo con un’entità di difficile definizione. Ed è pertanto che fin dal primo concepimento dell’idea, già due anni fa con il cortometraggio Frammenti di Anime Meccaniche, l’ombra di una domanda si è affacciata nella mia mente e in quelle di ciascun collaboratore che ha seguito questa sperimentazione cinematografica: abbiamo davvero bisogno di film scritti da IA?

Se nella risposta a questa domanda cerchiamo una qualche riaffermazione dello spirito umano è chiaro che più che occupare risorse per la produzione di storie scritte da IA dovremmo utilizzare queste tecnologie per facilitare e democratizzare il processo cinematografico stesso, affinché tutti possano raccontare la propria storia. Da anni mi piace profetizzare la diffusione nell’industria dell’intrattenimento di contenuti generati ad personam, ovvero di film, serie e programmi le cui premesse, stile e specifiche siano arbitrariamente e personalmente scelte dal singolo spettatore che, armato di servizi generativi avanzati, diventa regista delle proprie storie. Una prospettiva che, come è facile immaginare, porta con sé un’altra grande famiglia di problemi sia economici e culturali.

Se, invece, abbiamo la pazienza e l’umiltà di riconoscere la natura combinatoria di questi modelli generativi, allora credo che vi sia spazio per un sano dialogo sull’effettivo valore artistico di questi primi esperimenti. Non c’è dubbio che la grande potenza di questi strumenti sia pari solo alla quantità e alla qualità dei mastodontici corpus di testi iniziali sulla quale sono stati allenati. Ed è qui che a mio parere troviamo la vera magia del processo, ovvero la possibilità di relazionarsi con una massa (dis)ordinata di idee e narrazioni senza precedenti, la possibilità di attingere a una fonte che in tutto e per tutto pare appartenere all’Assoluto.

In attesa che possiate giudicare il prodotto ultimo di questo esperimento, non posso che continuare a domandarmi cosa esso effettivamente sia.