Lo scorso 27 settembre, il Tribunale di Amburgo ha pronunciato la prima decisione europea sul tema della riproduzione di opere dell’ingegno pubblicate su internet (nel caso di specie, una fotografia) per la creazione di dataset da utilizzare per l’addestramento di sistemi di intelligenza artificiale (in calce il testo della decisione originale). Riportiamo di seguito i punti salienti della sentenza con cui la corte tedesca, pur escludendo nella fattispecie l’applicabilità dell’eccezione c.d. di text and data mining (art. 4 della Direttiva UE 2019/790 sulla protezione del copyright nel mercato unico digitale – di seguito “Direttiva DSM”), ha fornito indicazioni estremamente utili a chiarire la portata dell’eccezione nel contesto dell’attuale scenario tecnologico e normativo.

I fatti

Il fotografo Robert Kneschke citava in giudizio LAION, organizzazione no-profit tedesca che rilascia gratuitamente modelli e dataset di intelligenza artificiale in open source, lamentando la riproduzione non autorizzata di una sua fotografia per la creazione di un set di dati finalizzato all’addestramento di sistemi di IA. La fotografia era stata pubblicata su internet, con il consenso dell’autore, come parte dello stock di una agenzia fotografica che ne concedeva in licenza i diritti al pubblico a titolo oneroso. La pubblicazione della fotografia, inoltre, era corredata da una dichiarazione di riserva presente sul sito web dell’agenzia che vietava espressamente la riproduzione automatizzata del database mediante tecniche di web scraping. Ciò nondimeno, la fotografia era stata riprodotta da LAION nell’ambito del processo di creazione del proprio data set, consistente in oltre 6 miliardi di immagini. Più precisamente, il data set controverso non conteneva di per sé riproduzioni di immagini protette dal diritto d’autore, piuttosto i dati di correlazione tra ciascuna immagine e l’URL che consentiva l’identificazione della risorsa sul web, correlazione che però, per essere “estratta” aveva richiesto il download di ciascuna immagine. La condotta di LAION scrutinata dal Tribunale, quindi, afferisce ad una fase preliminare dello sviluppo di sistemi di IA, quella relativa alla raccolta e selezione dei dati funzionali al training del sistema, restando per contro irrilevanti le riproduzioni effettuate a livello di elaborazione tutta interna al modello (c.d. black box) come pure a livello di output.

La riproduzione temporanea (art. 5, par. 1, Direttiva Infosoc).

Il Tribunale ha anzitutto escluso che la riproduzione in commento potesse considerarsi esentata dall’art. 5, par. 1, della Direttiva 2001/29/CE (“Direttiva Infosoc”), norma che sottrae all’esclusiva dell’autore gli atti di riproduzione che cumulativamente: (i) siano temporanei; (ii) siano transitori o accessori; (iii) costituiscano parte integrante ed essenziale di un procedimento tecnologico; (iv) siano eseguiti all’unico scopo di consentire la trasmissione in rete tra terzi con l’intervento di un intermediario o un utilizzo legittimo di un’opera o altri materiali protetti; (v) siano privi di un rilievo economico proprio. Nella fattispecie, la corte ha escluso tanto il requisito della temporaneità, dal momento che le riproduzioni contestate non erano destinate ab origine ad automatica cancellazione dopo un certo lasso di tempo, quanto l’elemento dell’indispensabile correlazione al procedimento di analisi dei dati, in quanto il download delle immagini non costituiva parte integrante ed essenziale del procedimento di analisi dei dati sottostanti, bensì era stato effettuato a monte in modo mirato e successivamente sottoposto ad uno specifico software di analisi.

La dichiarazione di riserva dell’agenzia fotografica (art. 4, par. 3, Direttiva UE 2019/790).

La corte si è poi soffermata sulla dichiarazione di opt-out contenuta sul sito web dell’agenzia fotografica da cui LAION aveva scaricato la fotografia controversa, e ha enunciato i seguenti principi:

  • La dichiarazione di riserva che consente di escludere l’eccezione di text and data mining, si applica a pieno titolo all’estrazione di testo e dati finalizzata alla creazione di data set destinati all’addestramento di sistemi di IA, come espressamente previsto dall’art. 53, par. 1, lett. c) del Regolamento UE 1689/2024 sull’intelligenza artificiale (“AI Act”);
  • La dichiarazione di riserva può essere effettuata direttamente dall’autore ovvero dai suoi successori o aventi causa, sì che nel caso di specie il titolare dei diritti poteva legittimamente avvalersi della dichiarazione di riserva espressa dall’agenzia fotografica. Essa, inoltre, deve essere effettuata in maniera espressa ed univoca, ma senza necessità di specifici riferimenti normativi all’eccezione di text and data mining.
  • La dichiarazione di riserva deve considerarsi espressa in modo appropriato, secondo quanto prescritto dall’art. 4, par. 3, della Direttiva DSM, anche se formulata in linguaggio direttamente comprensibile all’uomo (quindi, non in “linguaggio macchina”). In questo senso, l’art. 53, par. 1, lett. c) dell’AI Act, nell’imporre ai fornitori di modelli IA per finalità generali l’adozione di “tecnologie all’avanguardia” onde riconoscere una dichiarazione di riserva, prende in considerazione proprio il caso in cui l’opt-out sia espresso in linguaggio “naturale”. Sarebbe, inoltre, contraddittorio consentire ai fornitori di modelli di IA di sviluppare modelli sempre più potenti per la comprensione e la creazione di testi, da un lato, e allo stesso tempo non richiedere loro di utilizzare i modelli di IA esistenti per rispettare le limitazioni imposte dalla Direttiva DSM, dall’altro.
  • Il fatto che la Direttiva UE 1024/2019 sul riutilizzo dei dati del settore pubblico preveda al considerando 35 requisiti più stringenti per la “leggibilità a macchina” di un documento liberamente accessibile sul web, non rileva nel caso concreto, in quanto tale direttiva persegue obiettivi diversi dalla Direttiva DSM sulla protezione del copyright nel mercato unico digitale.

L’eccezione di estrazione di testo e dati per scopi di ricerca scientifica (art. 3 Direttiva UE 2019/790).

Esclusa l’operatività dell’eccezione di text and data mining, il Tribunale di Amburgo ha ritenuto che nella fattispecie la riproduzione contestata potesse nondimeno beneficiare della diversa eccezione di cui all’art. 3 della Direttiva DSM, che esenta le riproduzioni effettuate da organismi di ricerca ai fini dell’estrazione, per scopi di ricerca scientifica, di testo e di dati da opere o altri materiali cui essi hanno legalmente accesso. Tale conclusione è stata motivata sulla scorta delle seguenti considerazioni:

  • La creazione di un data set, che può costituire la base per l’addestramento di sistemi di intelligenza artificiale, può essere considerata una ricerca scientifica: sebbene la creazione dell’insieme di dati in sé non comporti un’immediata acquisizione di conoscenza, si tratta comunque di una fase di lavoro fondamentale con l’obiettivo di utilizzare l’insieme di dati per acquisire conoscenze in un momento successivo.
  • Nel caso concreto, depone in tal senso il fatto che il dataset fosse stato pubblicato gratuitamente e messo a disposizione dei ricercatori nel campo delle reti neurali artificiali, mentre è irrilevante il fatto che il medesimo set di dati venga utilizzato anche da aziende commerciali per l’addestramento o lo sviluppo dei loro sistemi di intelligenza artificiale, poiché anche la ricerca condotta da aziende commerciali rientra nel concetto di ricerca scientifica.
  • Il semplice fatto che singoli membri dell’organismo di ricerca svolgano anche attività remunerate per società commerciali che forniscono sistemi di IA, oltre al loro impegno per l’organismo di ricerca, non è sufficiente per attribuire all’ente no-profit le attività di queste società.

Conclusioni

La sentenza del Tribunale di Amburgo è destinata ad avere un impatto significativo in tutti gli Stati membri relativamente alla corretta interpretazione dell’eccezione di text and data mining, fornendo indicazioni di notevole importanza pratica in merito alla riproduzione di opere protette come data set di addestramento di sistemi di IA e sull’applicazione delle relative eccezioni. Essa, inoltre, avvantaggia le società specializzate nella raccolta di dati di addestramento, chiarendo che anche la fase c.d. di pre-training del modello di IA può beneficiare dell’eccezione di text and data mining, purché vengano rispettate le dichiarazioni di riserva dei titolari dei diritti.

Specularmente, l’aver equiparato la creazione di un dataset per finalità di addestramento ad un’attività di ricerca scientifica rilevante ai fini dell’eccezione prevista dall’art. 3 della Direttiva DSM, indebolisce la posizione dei titolari dei diritti, i quali non possono opporsi alla riproduzione delle loro opere laddove effettuata da enti o associazioni no-profit per finalità di pre-training (raccolta, selezione e filtraggio dei dati di addestramento) di modelli di IA.

Vale la pena aggiungere che le conclusioni del Tribunale di Amburgo potrebbero essere confutate dalla Corte di Giustizia UE in sede di interpretazione pregiudiziale delle disposizioni rilevanti della Direttiva DSM, tuttavia è indubbio che i chiarimenti della Corte, in particolare sulla portata dell’eccezione di text and data mining, risulterebbero inevitabilmente tardivi rispetto agli obblighi di compliance gravanti sui fornitori di modelli di IA per finalità generali a norma dell’art. 53, par.1, lett. c) dell’AI Act, i quali hanno tempo fino ad agosto 2025 per conformarsi alle prescrizioni del Regolamento. In ogni caso, utili orientamenti potranno essere tratti dalle linee guida contenute nel Codice (non vincolante) di buona condotta sui sistemi di IA per uso generale, di cui lo scorso 15 novembre è stato pubblicato un primo draft a cura della Commissione UE.

* Si ringrazia Alisa Auth per la traduzione del testo della decisione commentata che lasciamo di seguito. Disclaimer: La presente costituisce una traduzione di cortesia non ufficiale in lingua italiana della sentenza (…) Ughi e Nunziante non si assume né accetta alcuna responsabilità in merito alla correttezza della traduzione. Il testo in lingua tedesca prevarrà in caso di eventuale divergenza con la traduzione italiana, o di omissioni nell’ambito della stessa

Autori