Un algoritmo può dirci dove il mondo va in vacanza, in tempo reale, dalle foto postate sui social



PER CAPIRE dove la popolazione mondiale sta andando in vacanza e quanti turisti sono arrivati in Italia lo scorso anno basta un algoritmo. Un algoritmo che si nutre delle foto postate sui social: scatti di cocktail, spiagge e tramonti che non servono solo a far invidia agli amici, ma possono anche essere analizzati e usati per monitorare i flussi turistici su scala globale. Lo suggerisce un nuovo studio condotto dall’università di Warwick, nel Regno Unito, e pubblicato su Environment and Planning A, rivista accademica di urbanistica. Una ricerca che ha sfruttato le immagini geolocalizzate condivise pubblicamente su Flickr per capire gli spostamenti di oltre mezzo milione di utenti della piattaforma fotografica.

L’idea di partenza era semplice, spiega a Repubblica Federico Botta, ricercatore del Data Science Lab e uno degli autori dell’analisi: “Tutti pubblicano le foto dai luoghi in cui vanno in vacanza – dice – così abbiamo pensato che, analizzandole su larga scala, saremmo riusciti ad avere un quadro di quanti turisti arrivano in un determinato paese e da dove provengono. Informazioni disponibili in tempo reale e a costo zero, contrariamente alle statistiche compilate oggi che sono rilasciate solo mesi dopo e richiedono un gran dispendio di risorse”. Per testare la loro ipotesi, gli studiosi hanno collezionato 69 milioni di immagini postate su Flickr tra il 1 gennaio 2013 e il 31 dicembre 2014, a cui gli utenti hanno associato la posizione. Poi è arrivata la parte più difficile: capire la nazione di residenza di quegli utenti. Un obiettivo che gli studiosi hanno raggiunto esaminando i loro scatti pubblicati nei dodici mesi precedenti.

“Per ogni foto abbiamo determinato il giorno in cui è stata scattata e la localizzazione aggiunta”, prosegue Botta. “Poi i dati sono stati elaborati da un algoritmo che ci ha consentito di stabilire il luogo da cui una persona aveva postato più fotografie”. Se, per esempio, un utente aveva scattato la maggior parte delle immagini negli Stati Uniti prima di farne una nel paese di cui gli scienziati stavano stimando il flusso turistico, veniva considerato residente negli Stati Uniti. Un sistema che ha permesso a Botta e colleghi di capire quanti turisti nel 2014 sono stati in vacanza in Italia, Francia, Germania, Regno Unito, Canada, Giappone e Stati Uniti, nonché la loro provenienza. I ricercatori non hanno fatto delle stime vere e proprie, ma semplicemente evidenziato come i dati di Flickr siano allineati alle statistiche ufficiali.

Lo studio non manca di limiti: prima di tutto, in questo caso, sono stati usati i dati disponibili solo su Flickr, escludendo ad esempio Instagram, diventato il social d’elezione quando si tratta di condividere i propri scatti, inclusi quelli delle vacanze. Una scelta che limita la rappresentatività del campione considerato. Inoltre, per stabilire la nazione di residenza degli utenti, gli studiosi sono partiti da un presupposto semplicistico: nei giorni in cui un utente non posta alcuna fotografia, si presume che si trovi nello stesso luogo in cui ha scattato quella precedente. Nonostante questo, i risultati ottenuti si allineano alle statistiche ufficiali dei paesi presi in considerazione (in Italia quelle compilate dall’Istat), puntando i riflettori sulle potenzialità dell’analisi dei grandi dati per comprendere i flussi turistici e, più in generale, lo stato della società.

Del resto, non è la prima volta che gli algoritmi si rivelano capaci di monitorare le situazioni in tempo reale, grazie – ancora una volta – alla gigantesca mole di dati che quotidianamente mettiamo a disposizione online. Nel 2015, uno studio firmato dalla stessa università di Warwick aveva dimostrato di riuscire a usare tweet e dati provenienti dai telefoni cellulari per quantificare le dimensioni della folla. In particolare, avevano confrontato il numero degli spettatori di una partita di calcio a San Siro – calcolati usando i cinguettii geolocalizzati, le telefonate e le connessioni online effettuate tramite smartphone – con il pubblico effettivo che era noto per via dei biglietti staccati all’ingresso. Le stime erano state abbastanza accurate, con un margine d’errore compreso tra il 10 e il 20 percento.

Una capacità che può essere usata a fin di bene, come per preparare al meglio le strutture e le risorse per l’accoglienza dei turisti. Ma anche per implementare una stato di sorveglianza. In questa direzione, tre anni fa, ha fatto scalpore uno studio di Baidu, il gigante di ricerca cinese. I suoi scienziati erano riusciti a mettere a punto un sistema capace di anticipare di qualche ora la formazione di grandi assembramenti di persone in delle determinate aree, analizzando le ricerche fatte sulle mappe online del Google della Cina e mettendole a confronto con gli spostamenti reali delle persone geolocalizzate attraverso l’applicazione. E anche se all’epoca un portavoce dell’azienda chiarì che il meccanismo non era stato pensato per individuare le proteste indesiderate, chi può dire che un giorno le autorità non lo sfruttino a questo scopo? “I dati che condividiamo online possono essere utilizzati in un’infinità di modi – conclude Botta -. Compito della ricerca è anche mostrarne i potenziali impieghi, in modo che gli utenti diventino più consapevoli”.


http://www.repubblica.it/rss/tecnologia/rss2.0.xml

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *