Si possono mettere filtri, blocchi e accessi limitati alla sezione “Amministrazione Trasparente” di un Comune per evitare che vengano carpiti dati personali pubblicati online ai fini di addestrare l’intelligenza artificiale generativa?

No, in base al quadro normativo attuale (decreto legislativo n. 33/2013) non è possibile. Non si possono “introdurre soluzioni tecniche atte ad impedire ai motori di ricerca web di indicizzare ed effettuare ricerche all’interno della sezione Amministrazione trasparente, anche al fine di prevenire il web scraping”. Ciò perché in contrasto con quanto previsto dal decreto legislativo n. 33/2013.

E’ quanto l’Autorità Nazionale Anticorruzione ha deliberato con un parere del 30 gennaio 2025, approvato dal Consiglio di Anac.

“Tale assunto – scrive Anac – è confermato da quanto il Garante privacy chiarisce nel Provvedimento n. 329 del 20 maggio 2024 con cui la nota informativa è adottata. Nei ‘considerando’ del Provvedimento è, infatti, esplicitato che ‘restano ferme le disposizioni in materia di obblighi di pubblicazione per finalità di trasparenza di cui al d. lgs. n. 33/2013 e altre pubblicità legali, in materia di apertura dei dati e riutilizzo dell’informazione del settore pubblico ai sensi d. lgs. n. 36/2006, in materia di prevenzione della corruzione e trasparenza da parte di società ed enti di diritto privato controllati e partecipati dalle pubbliche amministrazioni e di enti pubblici economici, nonché le disposizioni previste da normative specifiche come quelle a tutela della proprietà intellettuale e del diritto d’autore”.

Anac precisa, comunque: “resta fermo che i dati personali contenuti negli atti e nei documenti pubblicati devono sempre essere trattati nel rispetto dei principi sul trattamento dei dati personali e dei regimi di accesso e riuso previsti ex lege”.

La richiesta di parere all’Autorità è giunta da una grande città capoluogo del Nord Italia. E’ stato chiesto quali misure a tutela dal web scraping dei dati personali pubblicati online potevano essere messe in atto dal Comune. Per addestrare modelli di intelligenza artificiale generativa, infatti, soggetti terzi effettuano raccolte massive di dati disponibili su internet.

Il Comune in questione chiedeva se era possibile adottare come misure difensive, per esempio, la creazione di aree riservate accessibili solo previsa registrazione e autenticazione; o l’inserimento di clausole antiscraping nei termini di servizio dei siti; o il monitoraggio del traffico verso le pagine web per individuare eventuali flussi anomali di dati in entrata e in uscita; o interventi specifici sui bot, utilizzando – tra le altre – le soluzioni tecnologiche rese disponibili dalle stesse società responsabili del web scraping.

Ad Anac veniva chiesto, in riferimento ai dati personali oggetto di pubblicazione obbligatoria nella sezione del sito “Amministrazione Trasparente”, quali misure potessero essere adottate per garantire la trasparenza e, nello stesso tempo, inibire le pratiche di web scraping. L’Autorità Anticorruzione, però, non ha potuto fare a meno di indicare che il decreto legislativo 33/2013 stabilisce l’accessibilità totale dei dati e documenti detenuti oggetto di pubblicazione obbligatoria ai sensi della normativa vigente, resi disponibili anche a seguito dell’accesso civico. Tali documenti devono essere, inoltre, pubblicati in formato di tipo aperto e riutilizzabili “senza ulteriori restrizioni” diverse dall’obbligo di citare la fonte e rispettarne l’integrità.

Il decreto dispone inoltre che gli obblighi di pubblicazione dei dati personali diversi dai dati particolari sensibili e dai dati giudiziari, possano essere diffusi attraverso siti istituzionali e trattati secondo modalità che ne consentano l’indicizzazione e la rintracciabilità tramite i motori di ricerca web e il loro riutilizzo. Ciò sempre nel rispetto dei principi che regolano il trattamento dei dati personali, in particolare di pertinenza e non eccedenza (cfr. Linee guida in materia di trattamento di dati personali, contenuti anche in atti e documenti amministrativi, effettuato per finalità di pubblicità e trasparenza sul web da soggetti pubblici e da altri enti obbligati pubblicate in G.U. n. 134 del 12/6/2014).

Anac evidenzia, poi, che la legge stabilisce che le amministrazioni non possano disporre filtri e altre soluzioni tecniche atte ad impedire ai motori di ricerca web di indicizzare ed effettuare ricerche all’interno della sezione “Amministrazione trasparente”.