Big Data: porre le giuste domande
Uno dei termini più diffusi nell’ultimo anno nella realtà del cyber-spazio è senza dubbio Big Data. Per i non addetti al settore, Big Data è un termine onnicomprensivo per indicare una raccolta di insiemi di dati così grande e complessa da non poter essere elaborata con le tradizionali applicazioni di analisi dei dati.
Con la crescita vertiginosa della rete mondiale di interconnessione e della quantità di informazioni che su di essa circolano in ogni istante, la quantità di dati presente in archivi distribuiti, localizzati o condivisi è diventata un’enorme mole di collezioni, spesso destrutturate, tale da rendere inefficienti i classici sistemi di indagine e interrogazione delle banche dati.
Le tradizionali banche dati che contenevano miliardi di informazioni relazionate sono così diventate dei piccoli recipienti tematici se confrontate con gli enormi oceani tumultuosi rappresentati oggi dalle collezioni Big Data. Questa crescita esponenziale delle informazioni ha evidentemente interessato anche tutto il processo della ricerca scientifica, se solo pensiamo ad esempio al progetto cartografico astronomico dello Sloan Digital Sky Survey, in grado di registrare oltre 200GB di dati per notte, oppure ai moderni acceleratori di particelle che raccolgono i dati di 150 milioni di sensori in grado ciascuno di inviare 40 milioni di informazioni al secondo.
In ogni smartphone in funzione nel mondo, un numero variabile di sensori (posizione, temperatura, pressione, campo magnetico, luminosità, ecc.) è in grado di registrare ogni secondo questi dati e inviarli verso le banche dati del gestore telefonico, così come la catena commerciale americana Walmart gestisce più di 1 milione di transazioni ogni ora da parte dei propri clienti.
Non occorrono altri esempi per capire che il fenomeno Big Data è una realtà spesso sconcertante per il numero di informazioni da gestire, e che ciò che oggi per noi è definito “Big“, non lo sarà più tra 5 anni dove occorrerà coniare altre terminologie e corrispondenti tecnologie di analisi.
Il mondo scientifico e tecnologico è pertanto in fermento in una corsa generale verso la ricerca degli strumenti più idonei per ottenere risposte da queste masse di dati così estese. Big Data rappresenta un cambiamento paradigmatico: dalla società della rete e della connessione l’approccio è sempre più proteso verso l’informazione e il database.
Ma la caratteristica più sorprendente che si rileva nell’avvicinarsi al fenomeno di Big Data, è che proprio a causa della dimensione e della destrutturazione dei dati, l’informazione non esiste fintantoché non viene formulata la domanda. Non è come in passato, quando non si era a conoscenza di dove fosse l’informazione seppur nella certezza che l’informazione stessa esistesse da qualche parte. Ad esmepio, un disco in un negozio, un libro in qualche libreria, un oggetto sugli scaffali; esisteva la determinazione della ricerca relazionata alla specifica domanda. Ora – e questa è la grande sfida – la risposta è “creata” dalla domanda, la quale ora viene ad assumere il ruolo più importante nella ricerca, oltre la risposta stessa.
Quindi il problema oggi diviene: come formulare la giusta domanda a una collezione Big Data? La domanda è molto più decisiva di tutte le possibili risposte.
Da questo postulato deriva l’esigenza di considerare assolutamente necessario un approccio transdisciplinare al problema dei Big Data. Lo stesso Platone, nell’Apologia di Socrate, scriveva: “il più grande bene dell’uomo è interrogarsi su se stesso, e indegna di essere vissuta è una vita senza tale attività“.
Il processo di indagine di un set di Big Data introduce elementi che vanno oltre le classiche discipline tecnico-scientifiche e l’azione di “porre la domanda” implica riflessioni che risiedono aldilà delle discipline stesse. Enzo Bianchi, Priore della Comunità di Bose, ha recentemente scritto (La Stampa, 25.09.2014, “Perché domandare significa vivere”): “Le domande, dunque, generano un humus complesso e diverso per ciascuno di noi, ed è in questo terreno che la nostra personale volontà può decidere il bene e il male, può discernere le domande e scegliere se impegnarsi in una risposta o lasciarle cadere“.
Senza un tale approccio, la ricerca in un Big Data potrebbe risultare sempre parziale e non raggiungere mai la completezza necessaria. Così come Parsifal non fu in grado di afferrare la conoscenza e salvare il re finché – dopo numerosi tentativi – non pose la giusta domanda ad Amfortas.