Al usar algunos de nuestros sitios web, encontrarás varias opciones de modo de escritura. En este artículo, explicaremos las diferencias entre ellas.
Al configurar las transferencias de Dataslayer a destinos en la nube como Google BigQuery, Google Cloud Storage (GCS), Database, Snowflake, Amazon S3 o Amazon Redshift, encontrarás una opción llamada Modo de escritura.
El modo de escritura define cómo se añadirán, insertarán o reemplazarán los datos nuevos en la tabla de destino o el bucket de almacenamiento. Elegir el modo correcto es crucial para mantener la precisión, el rendimiento y la consistencia de los datos.
Puedes configurar esta opción en la configuración de Destino al crear o editar tu transferencia:
Ejemplo
Modos de escritura disponibles en Dataslayer
Dataslayer admite tres tipos de modos de escritura en BigQuery, GCS, Database, Snowflake, Amazon S3 y Redshift:
-
Append (Añadir)
-
Replace (Reemplazar)
-
Upsert (Actualizar + Insertar)
Analicemos cómo funciona cada uno:
Append (recomendado)
Appedr es la opción más común y recomendada al enviar datos a BigQuery, GCS, Amazon S3, Snowflake, Redshift o Database.
Con este modo, los nuevos registros simplemente se agregan al final de la tabla existente, manteniendo intacta toda la información histórica.
- Si tu tabla ya tiene 10.000 filas, la próxima transferencia continuará desde la fila 10.001.
- Si la tabla está vacía, los registros se insertarán normalmente, comenzando desde la primera fila.
IMPORTANTE
Cuando el formato de los datos no coincide con la estructura de la tabla, el sistema bloqueará la transferencia para evitar errores y no se agregarán los registros. Obtén más información en este artículo.
Replace (Usar con precaución)
Replace elimina por completo todas las filas existentes en la tabla de destino y carga solo el nuevo conjunto de datos. Esto puede ser útil si necesita corregir errores de una importación anterior o actualizar los datos por completo, por ejemplo, en tablas de búsqueda pequeñas.
Dado que Replace elimina todos los registros existentes antes de cargar los nuevos datos, debe utilizarse con cuidado, especialmente cuando se trabaja con conjuntos de datos grandes.
Por eso, generalmente es mejor usar Append o Upsert a menos que estés seguro de querer sobrescribir todo.
Upsert (Actualizar + Insertar)
El modo Upsert actualiza los registros existentes en la tabla e inserta los nuevos que no estén presentes. Esto garantiza que la información obsoleta se actualice mientras se añaden nuevos datos sin problemas.
Esta opción tarda más en completarse ya que debe verificar y actualizar todos los datos importados previamente.
Upsert es especialmente útil cuando los datos ya almacenados están obsoletos. Sin embargo, no se recomienda para tablas muy grandes, ya que procesar y actualizar un gran volumen de registros puede aumentar el riesgo de errores.
Como siempre, contáctanos a través del chat en vivo en nuestro sitio web o por correo electrónico si aún tienes dudas o preguntas. ¡Estaremos encantados de ayudarte!