Fake News, blockchain e certificazione della notizia: cosa potrebbe mai andare storto?

  • 10/04/2020 00:00:00

La pandemia di coronavirus ha dato origine a un gazilione di notizie false che hanno dato vita a teorie complottiste tra le più colorate. Il fatto che rimangano sui social media di solito non crea grossi problemi. Tuttavia, quando queste si tramutano in fatti (come il dare fuoco alle torri “5G”) le cose diventano decisamente più serie.

La pandemia di coronavirus ha dato origine a un gazilione di notizie false che hanno dato vita a teorie complottiste tra le più colorate. Il fatto che rimangano sui social media di solito non crea grossi problemi. Tuttavia, quando queste si tramutano in fatti (come il dare fuoco alle torri “5G”) le cose diventano decisamente più serie.

Photo by Elijah O'Donnell on Unsplash

La pandemia di coronavirus ha dato origine a un gazilione di notizie false che hanno dato vita a teorie complottiste tra le più colorate. Il fatto che rimangano sui social media di solito non crea grossi problemi. Tuttavia, quando queste si tramutano in fatti (come il dare fuoco alle torri “5G”) le cose diventano decisamente più serie.

Allora ben vengano notizie di iniziative che lavorano sulla verifica delle fonti, come ha fatto ANSA con l’annuncio di ANSAcheck, il sistema che prevede di verificare la veridicità di una news attraverso il bollino “ANSA Check” e la certificazione di origine grazie a Blockchain.

E quindi è successo che mi sono interessato, e ho voluto approfondire l’iniziativa, perché ad un problema serio, mi aspettavo un approccio serio alla cosa. E visto il “hype” che c’è dietro a certi temi come Intelligenza Artificiale e Blockchain, la fake news è presto fatta.

Quindi togliamo il marketing, ovvero il 90% delle promesse.

Verificare la notizia

Faccio la doverosa premessa che le informazioni di seguito presentate sono frutto di dati pubblici accessibili navigando tutti i siti in questione e che non ho fatto nessun genere di tentativo di iniezione o richiesta che non fosse cliccare sui vari link.

L’intento di questa analisi era capire se una persona “comune” può verificare che la notizia provenga dal sito ANSA e che sia certificata la sua origine.

Apriamo una notizia qualsiasi che riporti il famigerato bollino:

Il link che ho aperto è questo (sperando che duri nel tempo). Per cronaca duratura nel tempo, mi permetto di riprendere l’immagine di intestazione dell’articolo per non perderla.

(il sottotitolo l’ho offuscato giusto per evitare di finire in violazione per aver riportato uno “snippet” eccessivo di testo - nda)

L’articolo riporta in calce la giusta nota di copyright e il bollino ANSACHECK.

Cliccando sul bollino, stando ai comunicati stampa, si dovrebbe andare ad una pagina che certifica la veridicità della notizia.

Prendiamo il significato alla lettera, perché ci tornerò tra non molto.

Nella sezione superiore troviamo l’elenco delle informazioni sulla “certificazione” della notizia. Tutto sembra in regola: un codice identificativo di un “blocco”, il hash del blocco (md5...) la marcatura temporale, l’altezza del blocco (nella blockchain di riferimento) e l’identificativo della transazione che si può verificare.

Tralasciando la scelta di utilizzare un algoritmo di hashing “obsoleto” come md5, sembra tutto in regola. Quindi si può cliccare sul registro pubblico per controllare che siano vere le informazioni. Il porta su Etherscan, un visualizzatore delle transazioni di Ethereum, la blockchain pubblica più diffusa per l’utilizzo di Smart Contract.

Il risultato è coerente con i risultati visualizzati sul sito ANSA:

Ma...

Trattandosi di una blockchain pubblica, è possibile vedere il contenuto della transazione. E il contenuto dei dati salvati nella blockchain è il seguente:

Tralasciando il contenuto criptico e poco avvincente (scusate la mancanza di effetti 3D) ritroviamo due informazioni che sono presenti nel “certificato del contenuto” di ANSA.

Ma dell’articolo, non c’è traccia: né autore, né titolo, né della notizia.

Allora sono tornato sul sito di ANSA, che sotto il “certificato” riporta i dettagli della verifica dell’integrità della news.

Ripropongo che questi sono tutti dati visibili all’utente e non è necessario né è stato fatto alcun tipo di accesso a informazioni non autorizzate per ottenere quanto sto documentando.

Cliccando su “verifica” parte un processo di verifica della news.

E qui la faccenda si complica, perché il dato che abbiamo in “blockchain” su Ethereum in realtà non è relativo alla singola notizia, ma di un blocco di notizie.

Il “BLOCK ID” nel certificato identifica un insieme di notizie, raggruppate insieme, nel caso del blocco qui analizzato, sono 59 notizie. Ogni notizia è rappresentata con un insieme di informazioni come questo:

Il “content hash” rappresenta il testo dell’articolo, tuttavia non è chiaro - né documentato - come sia possibile verificare che sia realmente quello il testo riportato.

I vari articoli sono quindi, come dicevo, raggruppati. Del risultato di questo raggruppamento viene effettuato un hash, ovvero una impronta digitale, con l’algoritmo md5.

Schematizzando questo processo, abbiamo come risultato il seguente diagramma.

Quindi per verificare la singola notizia, supponiamo con strumenti di terze parti, sarebbe necessario sapere:

  • quale sia l’algoritmo di calcolo del “hash” della singola notizia
  • avere l’elenco di tutte le notizie e calcolare i hash di tutte le notizie
  • calcolare il hash degli hash e vedere se coincide
  • cercare in una Blockchain pubblica il hash tra i miliardi di transazioni

Forse sbaglierò io, ma il concetto di verificabilità non è esattamente così.

Considerazioni

L’argomento “fake news” è un tema che mi sta particolarmente a cuore al pari del tema copyright, anche perché è uno dei motivi di discussione all’interno del gruppo di lavoro di Rights Chain, dove l’analisi del problema è un affare quotidiano.

Per come la vedo, probabilmente sbagliando, questo sistema non raggiunge nessuno degli obiettivi prefissati:

  • non è possibile verificare la singola notizia (parliamo del testo della notizia)
  • non è possibile verificare la veridicità della notizia

Affermare che la tecnologia “blockchain” è in grado di certificare la “veridicità” di una notizia è un azzardo che nessuno dovrebbe avere il coraggio di fare. Ancor meno quando il sistema non consente di verificare la veridicità di un dato. Anche perché, nel caso di esempio qui di sopra, la mancata verifica di uno dei 59 articoli (perché magari viene corretto un errore di ortografia) rende inutile la verifica automatica di tutti gli altri 58 articoli.

Certo il dato del “blocco” (altro termine improprio) è integro, ma resta il fatto che occorre un numero importante di dati per verificarne uno solo.

Peraltro, il comunicato stampa ufficiale dichiara che sia possibile risalire alla fonte originale della notizia, cosa che - tuttavia - non mi sembra sia possibile con i dati in possesso:

  • non è possibile calcolare il hash del testo
  • non è possibile verificare il singolo testo
  • il dato in blockchain non contiene dettagli sulla fonte

Da tecnico (anche tirando un po’ di acqua al mio mulino) un’adozione del genere di Blockchain è una mossa di solo marketing.

Da cittadino che si informa se le notizie che legge siano fondate o meno, non trovo nessun tipo di valore in un servizio che non mi permette di arrivare all’unica cosa che mi interessa sapere di una notizia:

  • chi sono le fonti?
  • è una notizia originale o è la copia della copia della traduzione della copia?
  • quando è stata pubblicata veramente?
  • di chi sono i diritti della notizia (ergo: posso riprodurla?)

ANSA check, di fatto, non mi da nessuna di queste informazioni e ancor meno mi permette di sapere se la notizia sia vera o falsa - visto che parliamo di fake news.

Acqua al proprio mulino

Il tema firma digitale è un tema decisamente caldo e importante in ambito Digital Content. Il pensiero di poter mettere una certificazione sull’integrità di un dato (sulla integrità del dato) e poter risalire a chi l’ha pubblicato è un tema che affrontiamo in Rights Chain dal 2017 (e prima in tema di Data Protection).

Per questa ragione abbiamo realizzato un sistema sì basato su un registro Blockchain ma interamente orientato su una soluzione dedicata al Digital Content e Diritto d’Autore, che non abbia le limitazioni di una Blockchain pubblica (prestazioni, accesso “pubblico”).

In particolare, rcAuthority è il nostro motore che elabora e memorizza le informazioni nel registro, basato su algoritmi di hashing (sha256) e contestualizzazione del dato: perché un “hash” da solo, abbandonato lì, non da nessuna informazione utile. Con l’aggiunta della trasparenza in termini di verifica, ovvero è possibile verificare con strumenti indipendenti di terze parti, se il dato (file o contenuto) salvato nel registro è quello che dice di essere. Tutto questo dal 2017, data in cui abbiamo avuto il piacere e orgoglio di avviare il blocco della genesi del registro Blockchain di Rights Chain.

Per combattere problemi come Fake News o violazione della proprietà intellettuale (come il diritto d’autore) affidarsi ciecamente e sconsideratamente alle tecnologie è completamente inefficace se non si ha - a mio avviso - una approfondita conoscenza del problema di base.

Aggiornamento al 05/05/2020

Io esco sempre dalla convinzione che le soluzioni, in linea con il principio evolutivo dell'ingegneria, tendono a migliorare col tempo, risolvendo problemi e perfezionando la soluzione. In constrasto con il "hype-marketing", che di perfezionato ha solo il clamore che riesce a generare di volta in volta.

In questo periodo buio in cui vai a cercare notizie sulla situazione cercando la fonte più attendibile possibile, leggendo un articolo mi son detto "ma sì, proviamo un po' a vedere il bollino anti fake-news".

Il risultato - che mi sarei aspettato una minima perfezionato rispetto all'originale - è il seguente.

Sottolineo, perché non si sa mai, che queste operazioni si fanno con l'utilizzo normale della pagina, quindi: scrollata verso il fondo, click sul bollino "notizia certificata".

Ed ecco qui qualche considerazione.

Ansacheck - marcature temporali e titoli

Generalmente una notizia, passata la revisione e mandato in linea, non dovrebbe subire variazioni se non con delle integrazioni che, a mio avviso, dovrebbero far parte del ciclo di "certificazione". In questo caso ci si ritrova con:

  • date di pubblicazione diverse da quelle sul sito
  • i titoli non combaciano

Ad onor del vero, guardando il sorgente della pagina, la meta-proprietà "modified_time" riporta l'ora indicata nel certificato, solo che - magari - sarebbe stato utile farlo vedere a chi visita la pagina. Mi riferisco, ovviamente, al fatto che qualcuno voglia realmente verificare che i dati siano coerenti.

Sempre osservando i campi "meta" nell'intestazione della pagina, è possibile trovare il seguente:

<meta name="data-newschain" content="54249e80a9b9fe442ae44e92c49708f5@ansa.newschain">

Il quale conferma, che l'informazione che stiamo guardando sul certificato è quella relativa all'articolo visualizzato.

E il problema è più profondo.

Analizzando il contenuto del blocco "AC202005041745" registrato nella transazione in questione, il titolo non c'è. La notizia referenziata nel blocco (che non è un blocco di blockchain - proviamo a ripeterlo) è la seguente:

{
"id": "54249e80a9b9fe442ae44e92c49708f5",
"title": "++ Oms, le tesi di Pompeo? La scienza sia al centro ++",
"content_hash": "40088463e74b7c5ea3b091ddabf7ca79",
"event": "publication",
"timestamp": "2020-05-04T17:42:00.000Z"
},

E qui, nuovamente:

  • titoli diversi
  • date ancora diverse

Personalmente, ed è un'opinione strettamente personale, questo non è fare un corretto uso della tecnologia. Bensì di fare tutto il possibile per ucciderne l'utilità, screditandone i principi di base e rendendola l'opposto di quello che potrebbe essere: ovvero, essere utile.

  • Contatti

Data Protection & Copyright

RIGHTS CHAIN LTD.

Networking & IT

RIVOLUZIONE DIGITALE SRL

Social Profile