Si parla di big data quando si ha un insieme talmente grande e complesso di elementi da richiedere la definizione di nuovi strumenti e metodologie per estrapolare, gestire e processare informazioni in tempi assai rapidi.
Ed è per la sicurezza di servizi essenziali come trasporti, elettricità, acqua che l’Enea mette in campo Obserbot (dall’anagramma delle parole observer e robot), un software che renderà possibile acquisire ed elaborare tutte le informazioni che circolano nel web sui danni subiti dalle infrastrutture critiche a causa di guasti, eventi naturali, ma anche attentati terroristici.
Realizzato da un gruppo di ricercatori dell’Enea, Obserbot è stato presentato il 2 febbraio a Roma nel corso del convegno “Big Open data analysis”.
“Si tratta di un software in grado di osservare in maniera totalmente automatizzata la rete grazie alla potenza della nostra infrastruttura di calcolo Eneagrid/Cresco e alla rete nazionale a banda ultralarga Garr – ha spiegato il responsabile del Laboratorio Enea di Analisi e protezione delle infrastrutture critiche, Vittorio Rosato”. “Tra le novità – ha aggiunto – anche la possibilità di acquisire i dati anche da social network, agenzie di stampa e blog. L’analisi di queste informazioni è molto delicata perché queste fonti richiedono una verifica approfondita del contenuto ma restituiscono una conoscenza diretta dello stato delle infrastrutture grazie alle informazioni messe in rete dagli utenti stessi, il cosiddetto fenomeno del crowdsourcing. In questo modo – ha concluso Rosato – inauguriamo anche un nuovo modo di ascoltare i cittadini e di renderli proattivi nel favorire la sicurezza e la protezione della collettività e dei servizi essenziali”
Il risultato ottenuto dal team Enea è stato la realizzazione di una piattaforma in continua espansione capace di arricchirsi, in modo del tutto automatizzato, con le informazioni su incidenti e blackout alle infrastrutture critiche pubblicate online dagli internauti. Dati che il software classifica in modo molto accurato secondo criteri elaborati a livello europeo insieme al centro di ricerca olandese “Tno” in base alla tipologia di evento (ad esempio calamità naturale, malfunzionamento, attacco o cattiva manutenzione) e di infrastruttura coinvolta, di località interessata, tempistica e danni conseguenti.
Attualmente la rete costituisce un’enorme fonte di informazioni su quanto avviene nel mondo, ma anche sulle persone, su ciò che pensano e le emozioni che provano. La dimensione del web è sconfinata: si stima che ci siano un miliardo di siti e cinque miliardi di pagine web. I social network contribuiscono costantemente all’aumento di queste dimensioni, visto che ogni secondo nel mondo vengono pubblicati 6.000 tweet e spediti oltre 2 milioni di messaggi di posta elettronica. In questo senso, l’analisi dei dati della rete costituisce un’incredibile sorgente di conoscenza e poter accedere a queste informazioni può risultare strategico anche per il progresso della ricerca scientifica.
“Grazie ad Obserbot – ha sottolineato il ricercatore Enea, Gregorio D’Agostino, team leader dello sviluppo del software – ora siamo in grado di individuare gli influencer, ossia quelle persone che più di altre contribuiscono alla formazione delle opinioni e degli interessi generali, e di misurare la tendenza dei navigatori virtuali ad essere influenzati. Un elemento rilevante per questi studi, sviluppati in collaborazione con la Boston University, è stato il concetto di ‘temperatura della lingua’ basato sulla frequenza di ripetizione delle parole nei testi, che consente di avvicinare l’analisi automatica di un messaggio a criteri più ‘umani’ nel processo di individuazione delle informazioni d’interesse”.