Según la Wikipedia, la estadística es una ciencia que estudia la recolección, análisis e interpretación de datos, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional.
Según el Instituto Nacional de Estadística “Puede decirse que la estadística es la herramienta que se utiliza cuando se quiere estudiar un hecho, el que sea, y no se conocen las leyes que lo rigen.”
En ambos casos, se trata de explicar hechos pasados mediante el análisis de datos.
Y si… pudiéramos anticipar el futuro…
En el documento de Concha Artola y Enrique Galán, “las huellas del futuro están en la web: construcción de indicadores adelantados a partir de las búsquedas en internet” (enlace) se indica que “El lanzamiento de la herramienta denominada Google Insights for Search (GIS) hace posible utilizar la ingente información sobre las búsquedas realizadas por los usuarios de Internet para construir indicadores adelantados en distintas áreas de conocimiento.” (pág. 16).
Pero el origen de esta línea de trabajo nos la encontramos en el campo de la epidemiología “Ginsberg, J. et al. (2008) analizaron los millones de búsquedas acerca de brotes de gripe de carácter no estacional y su relación con las visitas al médico. En el trabajo estiman con bastante precisión el nivel de incidencia semanal de la gripe en cada región de los Estados Unidos y generan indicadores que con un solo un día de retraso, adelantan la información estadística más convencional permitiendo un tratamiento más temprano y eficaz de la enfermedad.”
Entre las aplicaciones precursoras en el campo de la economía están los trabajos de Choi y Varian “Predicting the Present with Google trends” y “Predicting Initial Claims for Unemployement Benefits”, ambos publicados en 2009 en el Google Research blog.
El documento de Concha Artola y Enrique Galán trabaja sobre los flujos de turistas en España. En sus conclusiones, indican: “La mejora en la predicción que proporcionan los modelos de corto plazo que incluyen el G-indicador depende del modelo que se tome como referencia. Permite, no obstante, obtener un indicador ajustado del flujo de turistas británicos con casi un mes de adelanto. “
En este sentido, también destacamos el trabajo desarrollado desde BBVA Research, en especial la presentación realizada en día 16 de enero de este año: Indicadores BBVA-Google de Actividad Ecónomica.”
También centrado en el sector turístico, “Estos indicadores permiten mejorar la precisión y rapidez con la que anticipamos la entrada de turistas y pernoctaciones”.
Veamos un ejemplo práctico. Hemos cogido dos variables. Por un lado, las tasas de paro que registra el Instituto Nacional de Estadística (INE) en la Encuesta de Población Activa (EPA), desde el primer trimestre de 2005 hasta el último dato disponible, cuarto trimestre de 2011. Por otro lado, la evolución de las búsquedas en internet del término “paro” en España, ofrecida desde Google Trends.
Posteriormente, se ha hallado el promedio trimestral de los datos recogidos en Google Trends.
El siguiente paso ha sido indexar ambas evoluciones, sobre los datos del primer trimestre de 2005. Esto nos permite comparar la evolución de ambas variables, como podemos ver en el siguiente gráfico:
Es evidente la relación entre ambas variables, siendo las búsquedas una variable cuyo comportamiento muestra una mayor volatilidad.
Una ventaja que ofrece este sistema es que se puede controlar prácticamente en tiempo real, mostrando tendencias en la variable estudiada antes de obtener las estadísticas oficiales.
Por tanto, está claro que, en la elaboración de predicciones, es necesario la incorporación de las búsquedas por internet como valor de ajuste, ya que mejora la fiabilidad de las predicciones.
Por último, debemos señalar que la incorporación de las búsquedas por internet se puede realizar en aquellos ámbitos geográficos en los que Google supone más del 80% de las búsquedas, ya que otros buscadores no ofrecen en abierto las estadísticas de búsqueda.
Actualización:
Hoy día 27 de abril se han publicado los nuevos datos de la EPA para el primer trimestre de 2012. Actualizamos la gráfica:
Como puede verse, la relación entre ambas se ha cumplido. Esperamos que se cumpla también para el segundo trimestre (aunque la evolución de las búsquedas para el segundo cuatrimestre pueda aún cambiar).



Leave Your Comments Below