Big Data i turisme: nous indicadors per a la gestió turística

27 - 05 - 2014

Nota metodológica

1. Descripció dels datasets

A continuació descriurem amb detall els datasets utilitzats a l'estudi; com ara d'on s'obtenen i les limitacions potencials que tenen. En tots dos casos, els datasets se circumscriuen en l'àmbit geogràfic de les províncies de Madrid i Barcelona i en el període entre el 7 i el 21 d'octubre de 2012, ambdós inclosos.

1.1.Dataset de BBVA

El dataset es basa en les dades recollides pels sistemes de pagament electrònic de BBVA: operacions dutes a terme pels usuaris de targetes de crèdit o dèbit emeses per entitats estrangeres (clients estrangers) a comerços que utilitzin Terminals Punt de Venda (TPV a partir d'ara) gestionats per BBVA.

Per tal de distingir els turistes estrangers dels estrangers expatriats residents al nostre país, només s'han inclòs al dataset les targetes estrangeres que van dur a terme alguna transacció entre el 7 i el 21 d'octubre de 2012 i que, alhora, van romandre al nostre país un període igual o inferior a 15 dies durant tot el 2012.

Els TPV inclosos en aquest informe són els situats a les províncies de Madrid i Barcelona.

Les conclusions de l'estudi es basen directament en les dades recollides pels sistemes de pagament electrònic de BBVA. No s'han aplicat coeficients per deduir la totalitat dels pagaments duts a terme amb altres mitjans.

Aquestes dades són completament anònimes, s'ha treballat sobre dades agregades en el temps i l'espai després de suprimir degudament la informació sobre individus i persones jurídiques mitjançant processos irreversibles per tal de garantir la privacitat dels usuaris, en compliment de la Llei Orgànica de Protecció de Dades Personals 15/1999 i del reglament RD 1720/2007. L'ús de la informació procedent de les transaccions amb targeta en comerços i caixers de la ciutat es fa servir amb finalitats exclusivament estadístiques, i en cap cas pot derivar d'aquesta anàlisi el comportament de persones individuals.

Una característica que cal tenir en compte és que el pagament mitjançant targetes de crèdit o dèbit suposa una part dels pagaments totals duts a terme en un comerç, atès que aproximadament el 50 % de la despesa en comerços es du a terme mitjançant diners en efectiu. Aquest percentatge fluctua, entre d’altres, en funció de la categoria del comerç i del seu entorn, però també per biaixos culturals inherents a la nacionalitat de l'usuari. Cap dels resultats presentats en aquest informe és una extrapolació per deduir la despesa total duta a terme pels turistes estrangers, les xifres reflectides són les recollides pels mitjans de pagament electrònic BBVA i no s'han de prendre com a xifres absolutes de despesa amb qualsevol mitjà de pagament.

1.2.   Dataset de Telefónica

El dataset per a aquest estudi prové dels registres de certs esdeveniments de xarxa generats per telèfons amb SIM emeses per operadores de fora del territori nacional i que fan roaming connectats a la xarxa de Telefónica Móviles España. Exemples d'aquest tipus d'esdeveniments són la posada en marxa del telèfon, l'enviament d'un SMS, una trucada o un canvi d'àrea de cobertura. Quan es produeix un d'aquests esdeveniments, aquest es registra juntament amb l'estació de base (o antena) a la qual està connectat el telèfon i l'hora a la qual s'ha produït. Com que per a cada estació de base se’n coneix la localització exacta, això dóna una idea aproximada del lloc on es trobava el telèfon en aquell moment.

Simplificant, els registres que s'obtenen tenen el següent format:

Per tal de respectar la normativa de protecció de dades i per assegurar la privacitat, aquests registres s’han anonimitzat, ja que el número de targeta real se substitueix per un identificador únic, de manera que és impossible executar el procés a la inversa (no es pot obtenir el número de targeta a partir de l'identificador). Però, a més, els registres no es fan servir de manera individual: sempre de manera agregada per tal d'identificar comportaments de caràcter general (normalment segons nacionalitat) i mai de caràcter individual. Per si no n’hi hagués prou, la identitat dels propietaris dels telèfons en roaming (els utilitzats en aquest estudi) és una informació que Telefónica Móviles España no posseeix, ja que no es tracta d'abonats seus. Per tot això, és totalment impossible identificar de manera individual els propietaris d'aquests telèfons.

 

Com tots els datasets, aquest també presenta certes limitacions que convé conèixer. La situació dels telèfons no és totalment precisa, ja que la que en realitat es té és la de l'antena. En entorns urbans això no és gaire problemàtic, ja que la densitat d'antenes és prou alta com per oferir una precisió raonable; però pot ser-ho en zones rurals. Una altra limitació es pot produir a l'hora d'extrapolar dades totals a partir de la informació que s'obté. Per posar un exemple concret, no tots els telèfons dels turistes russos que visiten Espanya es connectaran a la xarxa de Telefónica, cosa que  implica que si es vol conèixer el total de telèfons russos cal dur a terme certes extrapolacions que poden introduir errors. Totes les dades que es presenten en aquest informe no estan extrapolades, de manera que no s'han de prendre com a absolutes. Però creiem que, tot i així, poden donar una idea bastant clara de la situació.

2. Privacitat

Aquest informe s’ha generat a partir de dades anonimitzades, agregades i posteriorment extrapolades mitjançant un procés estadístic, cosa que en garanteix la dissociació completa, de conformitat amb la LOPD 15/1999 i el reglament de desenvolupament RD 1720/2007, així com amb la Llei general de telecomunicacions 32/2003. S'impedeix de manera definitiva que cap individu pugui ser identificat a partir de les dades que s'han fet servir i així es garanteix la privacitat dels usuaris.

Les dades i recomanacions mostrades es basen en les dades recollides segons es descriu als apartats 5.1.1 i 5.1.2. No s'han aplicat coeficients que extrapolin tots els indicadors presents en aquest informe.

El tractament de les dades ha seguit un codi de conducta responsable per totes les parts, i s'ha dut a terme amb l'única finalitat d'afavorir un avanç en la transformació de la societat i del turisme.

Capítol: Nota metodològica