Calidad del dato y automatización de validaciones en GA4

En el Measure Camp Madrid de 2024 llevé una pequeña charla bien cargada de metodología y recursos. El objetivo: poder ayudar a otros analistas en una de las actividades más repetitivas y menos visibles de la profesión: la validación y cualificación de datos. La charla tuvo muy buena aceptación, incluso nos cambiaron de sala debido a la gran cantidad de interesados 😲. Una muy buena señal (que yo no me esperaba para nada) y que demuestra que este tema, aunque no sea de los más sexis, sin duda preocupa y es vital en el trabajo del analista.

Tabla de contenidos

La inestabilidad del ecosistema de datos web y app nos obliga a validar.

El efecto «Dev»: La Desviación estándar validable (una pequeña broma para romper el hielo) es el causante de una necesidad indiscutible. En webs vivas las mediciones se rompen. A veces drásticamente, otras con una simple variación de alguna variable que desmonta por completo nuestros informes y nuestra estadística.

En un mundo plagado de «Fake News» los negocios digitales se ven amenazados por el «Fake Data», a veces tan evidente como grandes picos y valles en las tendencias, otras muy sutil y peligroso.

Seamos claros: con datos falsos, nuestro trabajo no es solo inútil: es peligroso. Por eso resulta imprescindible validar el dato una y otra vez. Una validación que, a medida que el proyecto crece y se complica, es cada vez más lenta y tediosa.

No es raro, y esto lo validamos durante la charla con todos los asistentes, que cuando observamos el tiempo destinado a estos ejercicios descubramos horrorizados que puede llegar a ser más del 40% de nuestra dedicación. Una dedicación que nadie quiere que suceda. El negocio o cliente no la valora (la da por hecha) y el analista ve cómo pierde oportunidades de generar valor por culpa del tiempo que pierde validando en el día a día.

Sin embargo, este trabajo no es una elección. Validar y, sobre todo, cualificar los datos, es obligado y debe hacerse antes que cualquier otra tarea. ¿No todos validan? No. Gente vaga existe y existirá siempre. Pero las consecuencias de no hacerlo son demasiadas y con un impacto demasiado grande como para que puedas planteártelo:

  • Cambios que pasan desapercibidos
  • Gaps (brechas) en los datos.
  • Mediciones incorrectas que se mantienen en el tiempo
  • KPIs que se distribuyen erróneamente entre las dimensiones
  •  Incapacidad para creerte comparaciones temporales (MoM, YoY, etc.)
  • Datos decorados
  • Fake Insights

El momento no ayuda. GA4 y sus nuevas tecnologías lo complican todo.

Que el ecosistema digital, con la entrada de GA4, se ha tecnificado es más que evidente. Consent Mode, Cookies, Modelados, apps móviles. Y ahora, ¿por qué no? La entrada del inevitable mundo del server-side tagging.