Opendata, web e dolomiti

La libertà individuale ai tempi dei bigdata

Bigdata, computer e sofisticati algoritmi di analisi dei dati potranno limitare la libertà personale dell'individuo?

Molti termini alla moda (si pensi ad esempio "due-punto-zero", "green", "sostenibile", etc.) seguono un "ciclo di vita" simile a quello dei prodotti di consumo: in un primo periodo li sentiamo nominare da qualcuno del settore, poi diventano come il prezzemolo e vengono associati ad ogni parola in ambito economico-sociale ed infine passano di moda. Probabilmente una delle prossime parole che useremo ovunque sarà il termine "big-data", anzi secondo me sta già avendo il suo momento di successo. Quasi tutti ne hanno sentito parlare, molti ne vogliono capire di più, qualcuno ci sta lavorando. Ma a differenza di altre parole "di tendenza" il loro effetto sulla nostra vita sarà molto profondo.

Stanno già cambiando il mondo della ricerca per le discipline più complesse (fisica, biologia, medicina, etc.), stanno già "distruggendo" migliaia di posti di lavoro e ne stanno creando di nuovi, stanno già migliorando la vita di molte persone, hanno attivato una serie infinita di nuovi prodotti che quando entraranno nella nostra vita semplicemente ce la cambieranno.

La nostra libertà individuale è messa a rischio dai bigdata?

Ma c'è una questione etica che andrebbe analizzata profondamente fin da ora: "i bigdata ci limiteranno la libertà individuale"?

Grazie all'analisi sempre più profonda e precisa di grandissime quantità di dati riguardanti la nostra personalità, le nostre abitudini, i nostri interessi, etc. sarà possibile scoprire in maniera "quasi scientifica" qual è la nostra personalità e soprattutto come evolverà, se siamo o saremo propensi a delinquere, a compiere atti criminali e così via. Analizzando i nostri appunti di scuola, i nostri livelli di elementi chimici nel sangue quando facciamo determinate attività, i nostri tweet, incrociando fattori economici, geografici e sociali etc. etc. sapendo se siamo disoccupati, che articoli compriamo più spesso, che parole cerchiamo sui motori di ricerca, ...

Saremo colpevoli di crimini non commessi ma che avremmo commesso senza intervento

...ci saranno degli algoritmi in grado di scoprire (prima di noi stessi) la volontà a compiere crimini. La Giustizia del futuro potrà accusarci di essere colpevoli di crimini non commessi ma che avremmo commesso se non fossero intervenuti in modo preventivo.

Mentre nell'epoca pre-bigdata la nostra attenzione maggiore è rivolta alla privacy, nella rivoluzione bigdata dobbiamo garantire la libertà individuale, il libero arbitrio, la possibilità di fare scelte qualsiasi esse siano, anche quelle sbagliate!

Nel video seguente, Kenneth Cukier con un interessante monologo affronta la questione etica dei bigdata in modo sintetico ed illuminante. Qui la pagina ufficiale sul sito di Tedx: Kenneth Cukier, I Big Data sono dati migliori.

Buona visione.

Riporto il testo tradotto:

Qual è la torta preferita dagli americani?

Quella di mele. Ovviamente. Come lo sappiamo? Grazie ai dati. Guardate le vendite dei supermercati. Guardate le vendite dei supermercati relative alle torte surgelate di 30 centimetri. la torta di mele vince, non c'è gara. La maggior parte delle vendite è di torte di mele. Poi i supermercati hanno iniziato a vendere torte più piccole da 11 centimetri e improvvisamente la torta di mele cade al quarto o quinto posto. Perché? Cos'è successo? Pensateci. Quando comprate una torta da 30 centimetri tutta la famiglia deve essere d'accordo e la torta di mele è la seconda preferita di tutti. (Risate) Tuttavia quando comprate una torta da 11 centimetri potete acquistare quella che preferite. Potete avere la vostra prima scelta. Avete più dati. Potete vedere qualcosa che non potreste vedere con un quantitativo minore di dati.

Qui il punto è che più dati non ci fanno semplicemente vedere di più, ma di più della stessa cosa che stiamo osservando. Più dati ci permettono di vedere il nuovo. Ci permettono di vedere meglio. Ci permettono di vedere in modo diverso. In questo caso ci permettono di vedere che la torta preferita dagli americani è: non la torta di mele.

Probabilmente avete tutti sentito parlare di Big Data. Anzi, probabilmente siete stanchi di sentir nominare la parola Big Data. È vero che c'è stato molto clamore sull'argomento ed è un vero peccato perché i Big Data sono uno strumento veramente importante grazie al quale la società progredirà. In passato siamo stati abituati a guardare ai piccoli dati pensando a cosa potesse dire a cercare di capire il mondo e adesso ne abbiamo molti di più, molti di più di quanti ne abbiamo mai avuti prima. Scopriamo che quando abbiamo un gran quantitativo di dati, possiamo fare certe cose che non potevamo fare quando ne avevamo di meno. I Big Data sono importanti, i Big Data sono nuovi e se ci pensate l'unico modo che il pianeta avrà di gestire la sua sfida globale di nutrire le persone, fornire loro cure mediche, energia, elettricità, ed essere certi che non saranno carbonizzate a causa del riscaldamento globale è grazie ad un uso efficace dei dati.

Cosa c'è di nuovo sui Big Data? Qual è il punto? Per rispondere alla domanda, pensiamo all'aspetto delle informazioni, a come si presentavano fisicamente in passato. Nel 1908 sull'isola di Creta gli archeologi hanno scoperto un disco di argilla. L'hanno datato intorno al 2000 a.C., ha quindi circa 4000 anni. Su questo disco c'è un'iscrizione che effettivamente non sappiamo cosa significhi. È un completo mistero,ma il punto è che questo è l'aspetto che avevano le informazioni 4000 anni fa. È il modo in cui la civiltà archiviava e trasmetteva informazioni.

La civiltà non è poi così progredita. Immagazziniamo ancora informazioni su dischi solo che oggi possiamo immagazzinare molte più informazioni come mai prima d'ora. Ricercarle è più semplice. Copiarle è più semplice. Condividerle è più semplice. Elaborarle è più semplice. Inoltre possiamo riutilizzare queste informazioni per scopi che non avremmo mai immaginato quando per la prima volta abbiamo raccolto dati. A questo proposito, i dati sono passati da un blocco ad un flusso, da qualcosa di immobile e statico a qualcosa di fluido e dinamico. C'è, se volete, una liquidità nelle informazioni. Il disco scoperto a Creta vecchio di 4000 anni, è pesante, non può immagazzinare molta informazione e le informazioni non si possono modificare. Invece tutti i file che Edward Snowden ha preso dalla National Security Agency negli Stati Uniti sono contenuti in una chiavetta USB delle dimensioni di un unghia e possono essere condivisi alla velocità della luce. Più dati. Di più.

Una ragione per cui abbiamo così tanti dati nel mondo oggi è che raccogliamo cose delle quali abbiamo sempre raccolto informazioni, ma un'altra ragione è che stiamo prendendo cose che sono sempre state esplicative ma non le abbiamo mai rappresentate in forma di dati e le stiamo trasformando in dati.Pensate, ad esempio, alla questione della localizzazione. Prendete, ad esempio, Martin Lutero. Se nel 1500 avessimo voluto sapere dove fosse Martin Lutero avremmo dovuto seguirlo tutto il tempoprobabilmente con una penna d'oca e un calamaio per documentarlo, pensate a come funziona oggi.Sapete che da qualche parte nel database di un operatore delle telecomunicazioni c'è un foglio o perlomeno un database che raccoglie le vostre informazioni di dove siete in qualunque momento. Se avete un cellulare e quel cellulare ha il GPS, ma anche se non ha il GPS, può registrare le vostre informazioni. In questo senso la localizzazione è stata datificata.

Pensate ora, ad esempio, alla questione della postura il modo in cui tutti voi siete seduti ora, come sei seduto tu, come sei seduto tu, come sei seduto tu. Cambia in funzione della lunghezza delle vostre gambe, della vostra schiena, della forma della vostra schiena, se io mettessi dei sensori magari 100 sensori su ognuna delle vostre sedie proprio adesso potrei creare un indice unico per voi, una sorta di impronta digitale, ma non del vostro dito.

Cosa potremmo farci? Dei ricercatori a Tokyo li stanno utilizzando per un potenziale dispositivo antifurto delle auto. L'idea è che il ladro d'auto sieda dietro al volante, cerchi di avviare l'auto, ma lei riconosceche dietro al volante c'è un guidatore non approvato il motore si fermerà, a meno che voi non digitiate una password sul cruscotto che dica "Hey, ho l'autorizzazione a guidare". Grandioso.

Cosa succederebbe se ogni singola auto in Europa avesse questa tecnologia? Cosa potremmo fare allora? Forse, aggregando i dati potremmo identificare i segnali rivelatori che predicano al meglio che un incidente automobilistico sta per avvenire nei prossimi cinque secondi. Quello che avremmo datificatosarebbe l'affaticamento del guidatore e la funzione sarebbe che quando l'auto rileva che la persona sta crollando in una certa posizione sa automaticamente di dover attivare un allarme interno che faccia vibrare il volante e suonare un clacson interno per dire "Hei svegliati fai attenzione alla strada". Questo è il tipo di cose che possiamo fare quando datifichiamo più aspetti delle nostre vite.

Quindi, qual è il valore dei Big Data? Pensateci. Avete più informazioni. Potete fare cose che non avete mai potuto fare prima. Una delle aree più impressionanti dove questo concetto sta prendendo piede è nell'area dell'apprendimento automatico. L'apprendimento automatico è una branca dell'intelligenza artificiale che è a sua volta una branca dell'informatica. L'idea generale è che invece di dire ad un computer cosa fare dovremmo semplicemente inviargli i dati del problema e dire al computer di risolverlo da solo. Per comprenderlo, vi aiuterà vederne le origini. Nel 1950 l'informatico dell'IBM Arthur Samuel, al quale piaceva giocare a dama scrisse un programma per poter giocare contro il computer. Giocò. Vinse.Giocò. Vinse. Giocò. Vinse perché il computer sapeva soltanto quali fossero le mosse consentite. Arthur Samuel conosceva qualcos'altro. Arthur Samuel conosceva la strategia. Così scrisse un piccolo sub-programma da affiancare al primo, che lavorava in background. Tutto quello che faceva era registrare la probabilità che una certa configurazione della scacchiera portasse ad un risultato vincente o perdentedopo ogni mossa. Giocò con il computer. Vinse. Giocò con il computer. Vinse. Giocò con il computer. Vinse. Quindi Arthur Samuel lascio il computer a giocare da solo. Giocò da solo. Raccolse più dati.Raccolse più dati. Migliorò l'accuratezza delle proprie previsioni. Quindi Arthr Samuel ritornò al computergiocò e perse, giocò e perse, giocò e perse. Arthur Samuel aveva creato una macchina in grado di superarlo in un compito che gli aveva insegnato.

Questa idea dell'apprendimento automatico sta arrivando ovunque. Cosa ne pensate delle automobili che si guidano da sole? Saremmo una società migliore racchiudendo tutto il codice stradale in un software? No. La memoria è più economica. No. Gli algoritmi sono più rapidi. No, i processori sono migliori. No. Tutte queste cose sono importanti, ma non è il motivo. È perché abbiamo cambiato la natura del problema. Abbiamo cambiato la natura del problema da uno in cui abbiamo tentato di spiegare apertamente ed esplicitamente al computer come guidare a uno in cui diciamo, "Qui ci sono un sacco di dati sul veicolo. Devi capire. Capisci che quello è un semaforo che il semaforo è rosso e non verde il che significa che devi fermarti e non andare avanti."

L'apprendimento automatico è alla base di molte delle cose che facciamo online: motori di ricerca, gli algoritmi personalizzati di Amazon, traduzione computerizzata, sistemi di riconoscimento vocale. I ricercatori hanno recentemente osservato il problema delle biopsie, delle biopsie tumorali, hanno chiesto al computer di identificare, osservando i dati e le statistiche di sopravvivenza, di determinare se le cellule sono veramente tumorali oppure no e sicuramente quando mettendoci i dati, attraverso un algoritmo per l'apprendimento automatico la macchina è in grado di identificare i 12 segni distintivi che predicono al meglio che la biopsia delle cellule tumorali del seno sono effettivamente tumorali. Il problema: la letteratura medica ne conosce soltanto nove. Tre dei tratti erano quelli che non si cercavano, ma che la macchina ha individuato.

Nei Big Data ci sono anche dei lati oscuri. Miglioreranno le nostre vite, ma ci sono dei problemi dei quali dobbiamo essere consapevoli e il primo è l'idea che potremmo essere puniti per le previsioni, che la polizia potrebbe utilizzare i Big Data per i propri scopi un po' come in "Minority Report". Viene definita sorveglianza predittiva o criminologia algoritmica, l'idea è che se prendiamo molti dati, per esempio dove sono avvenuti i crimini in passato, sappiamo dove inviare le pattuglie. Questo ha senso, però il problema, ovviamente, è che tutto questo non si fermerà semplicemente ai dati di localizzazione arriverà a livello individuale. Perché non utilizzare i dati scolastici delle persone? Forse potremmo usare il fatto che siano disoccupate o meno, il loro punteggio, il loro comportamento su internet, se stanno svegli fino a tardi la notte. Il loro Fitbit quando sarà in grado di identificare la biochimica ci mostrerà che hanno pensieri aggressivi. Potremmo avere algoritmi in grado di prevedere cosa stiamo per fare e potremmo essere ritenuti responsabili prima di aver effettivamente fatto qualcosa. La privacy era la sfida centrale nell'era dei piccoli dati. All'epoca dei grandi dati la sfida sarà la salvaguardia del libero arbitrio, della scelta morale, della decisione umana, dell'azione umana.

C'è anche un altro problema: i Big Data ci ruberanno il lavoro. i Big Data e gli algoritmi metteranno alla prova i colletti bianchi, il lavoro di concetto del 21° secolo nello stesso modo in cui l'automazione industriale e le linee di assemblaggio hanno messo alla prova il lavoro dei colletti blu nel 20° secolo.Pensate ai tecnici di laboratorio che guardano in un microscopio ad una biopsia per il cancro per determinare se è tumorale oppure no. Questa persona è andata all'università. Questa persona acquista proprietà. Lui o lei votano. Lui o lei è un azionista della società. Il lavoro di questa persona, così come quello di un intero gruppo di professionisti come quella persona, si rivelerà radicalmente cambiatooppure del tutto eliminato. Ci piace pensare che la tecnologia crei lavoro nel tempo dopo un breve, temporaneo periodo di crisi esattamente come è stato vero in riferimento a quello che abbiamo vissuto durante la Rivoluzione Industriale perché è precisamente quello che è capitato. Abbiamo però dimenticato qualcosa in questa analisi: ci sono alcune categorie di lavoro che verranno semplicemente eliminate e non torneranno. La Rivoluzione Industriale non è stata esattamente un bene per i cavalli.Dobbiamo essere cauti e prendere i Big Data e adattarli alle nostre esigenze, alle nostre esigenze in quanto esseri umani. Dobbiamo essere padroni di questa tecnologia, non i suoi servitori. Siamo proprio all'inizio dell'era dei Big Data e onestamente noi non siamo proprio bravi nel maneggiare tutti i dati che siamo in grado di raccogliere. Non è soltanto un problema della National Security Agency Le aziende raccolgono tantissimi dati e ne fanno pure un cattivo utilizzo dobbiamo imparare a gestirli meglio e questo richiederà tempo. È un po' come la sfida che abbiamo affrontato da uomini primitivi con il fuoco.È uno strumento, ma è uno strumento che scotta se non si sta attenti.

I Big Data trasformeranno come viviamo, come lavoriamo, come pensiamo. Ci aiuteranno a gestire le nostre carriere e ci condurranno ad un vita di soddisfazione e speranza di felicità e salute ma in passato, molto spesso guardando all'Information Technology i nostri occhi hanno visto solo la T, la tecnologia, l'hardware, perché erano fisici. Adesso dobbiamo riadattare il nostro sguardo sulla I sull'informazione,che è meno appariscente ma in qualche modo molto più importante. L'umanità può finalmente imparare dalle informazioni che possono essere raccolte, come parte della nostra ricerca senza tempo per capire il mondo e il nostro posto in esso questo è il motivo per cui i Big Data sono una gran cosa.


Commenti