UNA APLICACIÓN APARA LA IDENTIFICACIÓN DE ESTACIONALIDAD Y OTRAS DINÁMICAS TURÍSTICAS
AutorA: Mª Isabel Landaluce Calvo.
1.- INTRODUCCIÓN
En todos los dominios (economía, medicina, ecología,…) la capacidad de generar datos es prácticamente infinita. Y no hay que olvidar que “el dato” es la materia prima del conocimiento. El paso del dato al conocimiento no es trivial, y requiere de una serie de técnicas que ayuden a descubrir patrones de comportamiento, relaciones, reglas, asociaciones o incluso excepciones útiles para el estudio de la realidad en cuestión.
Los métodos de análisis de datos han probado ampliamente su eficacia en el estudio de grandes masas complejas de información. Las representaciones gráficas simplificadas de grandes tablas de datos, “fotografías”, que estos métodos proporcionan son un instrumento de gran utilidad. Extraen las tendencias más sobresalientes y eliminan los efectos puntuales que pueden eclipsar la percepción global de los hechos.
Las técnicas factoriales ocupan un lugar primordial entre los métodos de análisis de datos, ya que permiten utilizar las facultades de percepción cotidianamente usadas en la observación de lo que nos rodea. En las representaciones gráficas de los datos que proporcionan se ven, en el sentido literal del término (con los ojos y el análisis que nuestro cerebro hace de una imagen) agrupaciones, oposiciones, tendencias,… imposibles de discernir directamente sobre una gran tabla de datos, incluso después de un examen prolongado.
En la figura 1 aparecen dos imágenes de un mismo objeto, ¿cuál de las dos aporta mayor información sobre las características del mismo? Todos estaremos de acuerdo que la respuesta es la “fotografía-2”. No obstante, también compartiremos la afirmación de que la “fotografía-1” aporta información distinta y también de cierta importancia para “descubrir” de qué objeto concreto se trata.
Figura 1: Diferentes fotografías de un mismo objeto

2.- PINCELADAS METODOLÓGICAS
Los métodos factoriales son técnicas de exploración estadística para la visualización aproximada (pero, en cierto sentido, óptima) de la información contenida en una tabla de datos: describen simultáneamente la asociación existente entre variables y la similitud entre observaciones. También se pueden entender como técnicas de reducción de la dimensión original de los datos, un paso intermedio con vistas a posteriores análisis explicativos, predictivos, etc. Esto es, se pueden utilizar como metodologías de “aprendizaje de los datos”.
El objetivo de los métodos factoriales se puede plantear como la obtención de representaciones gráficas simplificadas de las columnas (variables) y de las filas (observaciones) de una matriz. Estas “fotografías” de los datos se efectúan construyendo unas variables sintéticas (también denominadas factores), obtenidas como combinación lineal de las variables iniciales. Estas fotografías son “proyecciones” de los datos sobre subespacios que conservan el máximo de la información original. El paso de los datos originales a unas representaciones visuales interpretables por cualquier usuario conlleva una pérdida de información (que se intenta minimizar), pero a cambio se obtiene una ganancia en significación.
¿Cómo se “definen” las mejores “fotografías” de los datos? Para responder a esta pregunta previamente hay que tener en cuenta que el “magma” de los datos se configura en forma de nube de puntos. Por ejemplo, supongamos que la nube en el espacio original tiene forma de un lapicero (figura 2), pero nosotros sólo podemos verlo a través de su proyección sobre un subespacio de dos dimensiones, esto es, un plano. Las alternativas de proyección son diversas, pero es indiscutible que la proyección sobre el plano H1 proporciona mayor información que la proyección sobre el plano H2. H1 permite ver que se trata de un objeto alargado, con uno de sus extremos en forma de punta, mientras que en H2 todos los puntos salen agrupados en un círculo, sin dar una idea de la forma original de la nube. H1 se erige como el mejor plano de proyección de la nube original, esto es, la mejor fotografía de los datos iniciales. Sin embargo, ambos planos resultan complementarios.
Figura 2: Diferentes proyecciones de una misma nube de puntos

Esta es, en breves pinceladas, la filosofía metodológica que subyace en los métodos factoriales.
3.- APLICACIÓN A SERIES TEMPORALES: IDENTIFICACIÓN DE ESTACIONALIDAD Y OTRAS DINÁMICAS TURÍSTICAS EN ESPAÑA
En esta sección se recoge una propuesta novedosa para el estudio de la estacionalidad inherente a la demanda turística en España. Concretamente se va a poner de manifiesto la versatilidad de los planos factoriales como alternativa a los gráficos habituales de series temporales. La idoneidad de nuestra propuesta va a quedar ilustrada a través de una aplicación empírica. Para ello, se ha seleccionado el indicador que mide las “entradas de turistas según comunidad autónoma de destino principal” (correspondiente a la Encuesta de Movimientos Turísticos en Fronteras, FRONTUR) durante 10 años (enero 2006 – septiembre 2015). El Instituto de Estudios Turísticos (IET) proporciona esta información desagregada en siete ámbitos geográficos: Andalucía, Baleares, Canarias, Cataluña, C. de Madrid, C. Valenciana y resto de CCAA. Se ha trabajado con datos mensuales correspondientes a un período lo suficientemente amplio como para quedar reflejados hitos importantes en la evolución económica reciente de nuestra economía (final de una larga etapa de crecimiento, depresión y recuperación incipiente). Por tanto, los datos de partida están constituidos por siete series temporales, lo que amplía el objetivo inicial del estudio del perfil estacional de la demanda turística a un análisis comparativo a nivel geográfico.
La figura 3 refleja, a través de un gráfico habitual, la evolución del número de turistas de los siete territorios.
Figura 3: Evolución del número de turistas

Un estudio visual evidencia las conocidas diferencias de volumen de llegadas de turistas a las zonas seleccionadas; resultado esperado y lógico ya que se están comparando destinos turísticos muy distintos (turismo de sol y playa, turismo de interior,…) Esta diferente escala puede conllevar algunos riesgos en la interpretación de este gráfico que, sin otras herramientas métricas adicionales, siempre arrastra una carga de subjetividad. En la metodología propuesta este riesgo no existe al quedar equilibradas (por tipificación) las unidades de medida de los indicadores analizados. La nueva óptica que se propone proporciona, a través de diferentes planos factoriales (fotografías de los datos desde diversas ópticas) una visión más detallada y, por ello, más completa, de todas las posibles regularidades y de los patrones latentes en este tipo de información. En concreto, va a permitir dar respuesta, entre otras, a las siguientes preguntas: ¿La trayectoria turística, desde el punto de vista de la demanda, ha sido similar en los siete territorios considerados? ¿Cuáles mantienen las mayores similitudes? ¿Y las mayores diferencias? ¿En qué unidades temporales se han producido?
La figura 4 corresponde a la primera fotografía: plano principal en el que aparecen proyectadas las observaciones temporales (enero 2006 – septiembre 2015). En este gráfico queda reflejada la existencia de un claro perfil estacional en la evolución de la demanda turística, como principal seña de identidad de la trayectoria correspondiente a la mayoría de las zonas estudiadas. La parte derecha del plano permite visualizar los meses de mayor afluencia de turistas: destacando julio y agosto. Además, se puede comprobar que esta realidad es más notable en los últimos años (posición más extrema de los puntos asociados a 2013, 2014 y 2015), confirmando que en el sector turístico la senda del crecimiento económico se ha consolidado. En la parte izquierda quedan reflejados los meses en los que la afluencia de turistas es menor: noviembre, diciembre, enero, febrero y marzo, principalmente. En la zona central del plano se proyectan los meses con una afluencia media: abril, mayo, junio, septiembre y octubre.
Una vez detectado el patrón dinámico común, a continuación se visualizarán fotografías apropiadas para el análisis detallado de las diferencias, si las hubiese, entre los siete territorios (figuras 5, 6 y 7).
Figura 4: Plano factorial principal de las observaciones temporales1

Figura 5: Plano factorial principal de las trayectorias individuales.

Fuente: Elaboración propia a partir de los resultados del programa SPAD
La observación de la figura 5 (fotografía panorámica) permite concluir que Andalucía, Baleares, Cataluña, C. Valenciana y resto de CCAA tienen claramente un comportamiento estacional similar. Sin embargo, Canarias y Madrid se alejan del resto, reflejo de sus particularidades, que habrá que analizar por separado (figuras 6 y 7, respectivamente).
1 La identificación de los puntos en el plano, aaa-XX, corresponde a las tres primeras letras del mes (aaa), a los dos últimos dígitos del año (XX).

Figura 6: Proyección de la trayectoria individual de la Comunidad Canaria2

Zoom de una única serie temporal
La figura 6 (zoom de Canarias) revela que el principal componente de los flujos de turistas en la región insular es la tendencia (y no la estacionalidad como en el resto). Una tendencia que queda reflejada a lo largo del eje vertical, con claros repuntes en los últimos años de la serie (2014 y 2015). Los menores valores en el número de turistas llegados a las islas corresponden a los meses de los años más azotados por la reciente crisis económica (principalmente 2009 y 2010). Otra peculiaridad que merece ser destacada: los repuntes en Canarias se producen en los meses de menor flujo de turistas para el resto de regiones (enero, febrero, marzo,…)
Figura 7: Proyección de la trayectoria individual de la Comunidad de Madrid3


Zoom de una única serie temporal
Fuente: Elaboración propia a partir de los resultados del programa SPAD
2 La identificación de los puntos en el plano, aaa-XX G3, corresponde a las tres primeras letras del mes (aaa), a los dos últimos dígitos del año (XX) y G3 se asocia a la variable “número de turistas llegados a la Comunidad de Canarias”.
3 La identificación de los puntos en el plano, aaa-XX G6, corresponde a las tres primeras letras del mes (aaa), a los dos últimosdígitos del año (XX) y G6 se asocia a la variable “número de turistas llegados a la Comunidad de Madrid”.
La figura 7 pone de manifiesto que la Comunidad de Madrid sí presenta un cierto perfil estacional, aunque menos marcado que el resto, con mayores irregularidades. Por simplificación y, para ilustrar de forma clara la realidad de esta región, se han proyectado los puntos más informativos. En lo que respecta a los meses de menor afluencia de turistas, esta región no presenta rasgos diferenciales (siguen correspondiente a enero y febrero). Sin embargo, en esta CCAA los meses de mayor afluencia no son siempre y únicamente julio y agosto (también aparecen proyectados los meses de abril, mayo, octubre…) Asimismo, queda evidencia de que el indicador turístico no se vio tan resentido en esta zona, como en otras, en los años caracterizados por la dureza de la crisis económica en España (2009, 2011…)
Conclusión: las “fotografías” factoriales analizadas han permitido dar respuesta a las preguntas que anteriormente dejábamos planteadas, evidenciando la utilidad e idoneidad de la metodología propuesta para el objetivo perseguido.
5.- REFERENCIAS
ABASCAL E. y GRANDE I. (2005). Análisis de Encuestas. ESIC. Madrid
ALUJA, T y MORINEAU, A. (1999). Aprender de los datos: El Análisis de Componentes Principales. Una aproximación desde el Data Mining. EUB. Barcelona
LANDALUCE, M.I. (2017). “ Enfoque exploratorio multivariante para el análisis de estructuras temporales. Una aplicación a la evolución de la demanda turística en España.” Estudios de Economía Aplicada, Volumen 32-nº 2, pp. 465-492