En el Measure Camp Madrid de 2024 llevé una pequeña charla bien cargada de metodología y recursos. El objetivo: poder ayudar a otros analistas en una de las actividades más repetitivas y menos visibles de la profesión: la validación y cualificación de datos. La charla tuvo muy buena aceptación, incluso nos cambiaron de sala debido a la gran cantidad de interesados 😲. Una muy buena señal (que yo no me esperaba para nada) y que demuestra que este tema, aunque no sea de los más sexis, sin duda preocupa y es vital en el trabajo del analista.
- Puedes ver los slides de la presentación al final de este post.
- Seguidamente se resumen todos los detalles de los que hablamos.
Tabla de contenidos
La inestabilidad del ecosistema de datos web y app nos obliga a validar.
El efecto «Dev»: La Desviación estándar validable (una pequeña broma para romper el hielo) es el causante de una necesidad indiscutible. En webs vivas las mediciones se rompen. A veces drásticamente, otras con una simple variación de alguna variable que desmonta por completo nuestros informes y nuestra estadística.
En un mundo plagado de «Fake News» los negocios digitales se ven amenazados por el «Fake Data», a veces tan evidente como grandes picos y valles en las tendencias, otras muy sutil y peligroso.
Seamos claros: con datos falsos, nuestro trabajo no es solo inútil: es peligroso. Por eso resulta imprescindible validar el dato una y otra vez. Una validación que, a medida que el proyecto crece y se complica, es cada vez más lenta y tediosa.
No es raro, y esto lo validamos durante la charla con todos los asistentes, que cuando observamos el tiempo destinado a estos ejercicios descubramos horrorizados que puede llegar a ser más del 40% de nuestra dedicación. Una dedicación que nadie quiere que suceda. El negocio o cliente no la valora (la da por hecha) y el analista ve cómo pierde oportunidades de generar valor por culpa del tiempo que pierde validando en el día a día.
Sin embargo, este trabajo no es una elección. Validar y, sobre todo, cualificar los datos, es obligado y debe hacerse antes que cualquier otra tarea. ¿No todos validan? No. Gente vaga existe y existirá siempre. Pero las consecuencias de no hacerlo son demasiadas y con un impacto demasiado grande como para que puedas planteártelo:
- Cambios que pasan desapercibidos
- Gaps (brechas) en los datos.
- Mediciones incorrectas que se mantienen en el tiempo
- KPIs que se distribuyen erróneamente entre las dimensiones
- Incapacidad para creerte comparaciones temporales (MoM, YoY, etc.)
- Datos decorados
- Fake Insights
El momento no ayuda. GA4 y sus nuevas tecnologías lo complican todo.
Que el ecosistema digital, con la entrada de GA4, se ha tecnificado es más que evidente. Consent Mode, Cookies, Modelados, apps móviles. Y ahora, ¿por qué no? La entrada del inevitable mundo del server-side tagging.