Mejores formas de cargar datos históricos en BigQuery

A la hora de subir datos a Big Query, podemos encontrar diferentes opciones en función de nuestras necesidades.

No es lo mismo subir datos de un par de meses que de varios años, por lo que vamos a ver las diferentes opciones que tenemos a la hora de transferir nuestra información utilizando Dataslayer.

Si no conoces nuestro producto Big Query te explicamos todo lo que necesitas saber en esta FAQ.

Menu de BigQuery

 

Para cargar datos históricos, la opción manually es la más indicada, pero dependiendo de la cantidad de datos que tengamos, a veces puede ser mejor elegir la opción manually splitted.


Una vez creada la consulta, debemos prestar atención al rango de fechas que hemos seleccionado y a la cantidad de datos que tenemos para ese rango de fechas.

 

Opción manually


Si tienes un volumen pequeño de datos (un mes, o un año con poca información): Puedes utilizar la opción manual para una carga inmediata de sus datos. La opción manual funciona de tal manera que carga todos los datos a la vez.

Rango de fechas de un mes

 

Opción manually splitted

Si tienes un gran volumen de datos (un mes con muchos datos y muchas cuentas, o más de un año): Puedes utilizar la opción manually splitted, para evitar tiempos de espera, interrupciones y errores. Esta función divide las consultas por grupos y las ejecuta periódicamente, de forma que los datos se irán cargando poco a poco de forma ininterrumpida.

Importante: Ten en cuenta que esta función SOLO se puede ejecutar cuando la consulta tiene DIMENSIONES TEMPORALES añadidas.

Cuando se utiliza esta opción, la consulta puede tardar mucho tiempo, por lo que una vez ejecutada, aunque se cierre el navegador, la consulta seguirá ejecutándose.

Rango de fechas de cinco años

 

Una vez que tengas tus datos históricos, la mejor práctica es modificar el rango de fechas de la transferencia a ayer y establecer la opción de programación.

Advertencia: Asegúrate de que tu conjunto de datos tiene la fecha de caducidad por defecto establecida en nunca, de lo contrario las tablas se borrarán automáticamente. Lo explicamos aquí.

Opción Schedule (programación)

Selecciona esta opción para programar cargas periódicas. Ideal para mantener los datos actualizados periódicamente.

Opción schedule

 

Si sigues teniendo dudas o preguntas no dudes en ponerte en contacto con nosotros a través del chat en directo de nuestro sitio web o por correo electrónico. ¡Estaremos encantados de ayudarte!