Modelos de usuario en GA4: ¿Sabes lidiar con los datos modelados del Consent Mode?

En el entorno digital actual, identificar correctamente a los usuarios se ha convertido en un desafío complejo. Las crecientes preocupaciones por la privacidad y regulaciones como el GDPR han limitado la capacidad de las herramientas de analítica para rastrear a los usuarios de manera individual. Esto impacta directamente en la forma en que las empresas capturan sus datos en analítica y forma un pequeño caos que cada empresa resuelve según sus habilidades y sus creencias.

Google Analytics 4 (GA4) dispone de lo que llaman modelos de identidad del usuario para adaptarse a esta realidad cambiante y dejar a cada negocio decidir cómo desea ver a sus usuarios en la herramienta. Comprender estos modelos y sus implicaciones es vital para entender los datos que estás viendo y poder tomar decisiones en base a ellos. Por desgracia, este no es siempre el caso y mutitud de negocios ni siquiera saben qué modelo de usuario están usando en su GA4.

Este post tiene como objetivo guiarte a través de los modelos de identidad en GA4, profundizando en cómo funcionan y cómo afectan a tus informes. Exploraremos cada identificador de usuario, las configuraciones disponibles y proporcionaremos ejemplos prácticos para ayudarte a aprovechar al máximo estas herramientas. Entre todos estos detalles, hablaremos (y no poco) de los usuarios modelados, esos usuarios que GA4 identifica gracias al famoso Content Mode y que pueden provocar tantas alegrías como frustraciones en tus análisis.

Los 4 identificadores de usuario que puede usar GA4

Google Analytics 4 dispone de cuatro identificadores posibles de usuario que se utilizan en orden jerárquico para proporcionar una visión coherente del comportamiento del usuario. Es decir, tiene 4 sistemas distintos con los que detectar si las sesiones que recibe son o no de las mismas personas.  Con estos 4 sistemas es como se crean los usuarios, pero no se trata como en el antiguo universal annalytics de elegir uno de ellos, sino que varios de estos datos se unen usando unos u otros en función de si están o no disponibles.

1. El User ID

El User ID es un identificador único que tú, como propietario del sitio o aplicación, puedes asignar (mediante implementación) a cada usuario registrado. Este identificador es opcional y requiere que pases explícitamente este dato a GA4 desde tu sistema ya sea por dataLayer, gtag, sdk o como sea. Es especialmente útil en escenarios donde los usuarios inician sesión, como en sitios de comunidades, plataformas educativas o aplicaciones con áreas privadas.

La principal ventaja del User ID es que permite un seguimiento preciso del usuario a través de múltiples dispositivos y sesiones. Al tener un identificador consistente, puedes unir las interacciones de un mismo usuario que visita tu sitio desde su móvil y luego desde su ordenador de escritorio. Esto mejora la granularidad de los datos y te permite construir informes accionables que reflejen con mayor precisión el recorrido del usuario.

Sin embargo, el uso del User ID tiene sus limitaciones. Si tu sitio no tiene una funcionalidad de inicio de sesión o si el porcentaje de usuarios registrados es bajo, este identificador pierde efectividad. Además, implementar el User ID requiere una configuración avanzada y una parametrización adecuada en tu sitio o aplicación, lo que puede implicar recursos técnicos adicionales.

2. Google Signals

Google Signals es una funcionalidad que utiliza datos de usuarios que han iniciado sesión en sus cuentas de Google y que han habilitado la personalización de anuncios. Al activar Google Signals en GA4, puedes aprovechar esta información para deduplicar usuarios y entender su comportamiento en diferentes dispositivos.

Esta herramienta es especialmente valiosa para capturar las interacciones clave de usuarios anónimos pero logueados en Google. Por ejemplo, un usuario que visita tu sitio desde su móvil y luego desde su ordenador podría ser reconocido como el mismo individuo, mejorando así la organización de los eventos y permitiéndote construir informes más detallados.

No obstante, Google Signals requiere que los usuarios hayan dado su consentimiento para la personalización de anuncios, lo que significa que no todos los visitantes estarán incluidos. Esto puede afectar la granularidad de tus datos, y es importante tener en cuenta que la activación de Google Signals en GA4 es un paso manual que debes realizar en la configuración de tu propiedad.

3. El ID de dispositivo (cookie o device ID)

El ID de dispositivo es el método más común y tradicional para identificar usuarios únicos en la web y aplicaciones móviles. En sitios web, se basa en el uso de cookies, pequeños archivos que se almacenan en el navegador del usuario. En aplicaciones móviles, se utiliza el Instance ID, un identificador único para cada instalación de la app.

La principal ventaja del ID de dispositivo es su facilidad de implementación. Es la base del seguimiento en la mayoría de los sitios y aplicaciones, permitiéndote capturar de manera granular las interacciones de los usuarios sin necesidad de configuraciones adicionales. Esto facilita la parametrización adecuada y la organización de los eventos para un análisis posterior.

Sin embargo, las cookies pueden ser bloqueadas o borradas por los usuarios, lo que afecta la precisión en la identificación. Además, este método no permite unir usuarios a través de diferentes dispositivos o navegadores, lo que limita la comprensión completa del recorrido del usuario. Es aquí donde opciones como el User ID o Google Signals pueden complementar y mejorar la calidad de los datos.

4. Los usuarios modelados

Los usuarios modelados son una solución innovadora que GA4 introduce para afrontar los desafíos de la privacidad y el consentimiento del usuario. Cuando los usuarios no permiten el seguimiento tradicional—por ejemplo, al rechazar las cookies—GA4 utiliza algoritmos de machine learning para estimar su comportamiento. Esto es posible gracias al Consent Mode avanzado.

Este modo permite que, incluso sin identificadores personales, se capturen ciertos eventos anónimos. GA4 utiliza estos datos para modelar el comportamiento del usuario, rellenando los vacíos y permitiéndote construir informes más completos. Esto optimiza la recolección de datos y te ayuda a evitar la pérdida de información crucial para tu análisis.

Sin embargo, la inclusión de usuarios modelados introduce cierta incertidumbre. No siempre es posible saber qué datos son estimados y cuáles son reales, lo que puede afectar la confianza en los informes accionables. Es importante ser consciente de estas limitaciones y considerar cómo pueden influir en tus decisiones basadas en datos.

La aplicación jerarquica de la identificación del usuario

Acabamos de describir 4 sistemas distintos por los que GA4 puede identificar a los usuarios (saber que varios eventos son de un mismo usuario). Pero ¿Como conviven entre ellos? Luego hablaremos de lo que tu puedes hacer en la configuración de tus propiedades para elegir cuales de estos sistemas entran en juego, pero empezaremos diciendo que cuando conviven varios de ellos siempre se aplican en orden y de forma jerarquica, siempre con el mismo peso.
  1. User Id, lo primero que hace GA4 es intentar usar el User Id que se le ha pasado como parámetro en los eventos. Si tus eventos tienen implementado el User Id este manda y de ahí saca el usuario.
  2. Google Signals, solo cuando los eventos no tienen User Id, GA4 intenta sacar el usuario de sus Google Signals. Para eso la propiedad de GA4 debe tener activo el uso de Google Signals (algo esencial para campañas de remarketing de Google Ads). Si lo tiene activo, podrá usarlo para identificar a los usuarios de Google.
  3. Device Id, cuando Google Analytics no tiene ni User Id, ni Google Signals, debe ir a los datos de verdad, los de cookies o el instance Id. Ahí es donde acude la mayor parte de las veces en la mayoría de negocios. Este es por lo tanto el método más importante de los 4.
  4. Cuando el Device Id no existe, pues el usuario no aceptó cookies, pero si que tenemos datos (porque se implementó el Consent Mode Avanzado) entonces entra en juego la capacidad de modelar usuarios. Esto es: Google no tiene IDs de usuario, pero los asigna con su comportamiento y los datos de los que si dispone. Esto no lo consigue con todos los usuarios que no aceptan cookies, pero si con un buen porcentaje de ellos (60% o más de media en sitos grandes).

Como se ve en realidad es bastante sencillo: cuando no tiene un dato, va a por el siguiente.  Pero ¿Qué pasa si aplica los 4 métodos y sigue sin saber el usuario? Pues que ese dato no lo verás en GA4, no te lo muestra. Ese es el Gap (brecha) de eventos que provoca la ley de cookies, incluso con todo el ML de Google.

El Consent Mode avanzado en Google Analytics 4

El Consent Mode avanzado es una característica que permite a GA4 adaptarse a las preferencias de privacidad de los usuarios. Cuando un visitante no otorga su consentimiento para el uso de cookies o identificadores, este modo permite que aún se recopilen ciertos datos de manera anónima. Esto es esencial para respetar las regulaciones de privacidad y, al mismo tiempo, mantener un nivel de información útil para el análisis.

Cómo funciona:

Existen 2 formas de implementar el Consent Mode, una básica que lo que hace es no enviar datos hacia GA4 para los usuarios cuando bloquean cookies y una avanzada, que envia datos pero anonimizados (lo que llamamos en analítica «pings»)

El Consent Mode avanzado requiere ajustes en la implementación tu site o app. Lo normal es implementar el Consent Mode a través de Google Tag Manager o directamente en el código, especificando qué tipos de cookies y seguimientos están permitidos según el consentimiento del usuario. En lugar de bloquear completamente el seguimiento, se envían datos anónimos que no contienen identificadores personales. Esto incluye todos los eventos: visitas a páginas, clics y conversiones, pero sin asociarlos a un usuario específico.

GA4 utiliza luego estos datos anónimos junto con algoritmos de machine learning para estimar el comportamiento de los usuarios que no han dado su consentimiento completo. Esto permite rellenar los vacíos en tus informes y mantener la integridad de algunos análisis. Sin embargo, es importante destacar que, aunque el Consent Mode avanzado mitiga la pérdida de datos, los usuarios modelados generados a partir de él no son una representación exacta de los usuarios reales. Es «magia», si, pero no una magia exacta que todo lo puede.

Beneficios:

El principal beneficio del Consent Mode avanzado es el cumplimiento legal. Respeta las regulaciones de privacidad al no almacenar información personal sin consentimiento. Además, permite que no pierdas toda la visibilidad sobre las interacciones  tu propiedad, lo que acaba mejorando la credibilidad de los datos en muchos escenarios.

Por otro lado, aunque el Consent Mode avanzado optimiza la recolección de datos, es esencial entender que los datos modelados no siempre reflejan con precisión el comportamiento real del usuario. Por lo tanto, se debe tener precaución al interpretar los informes y al basar decisiones en estos datos estimados. De esto último hablaremos largo y tendido en las siguientes partes del post.

Las 3 configuraciones de usuarios en GA4

Google Analytics 4 te ofrece tres modelos de identidad de usuario que puedes configurar según las necesidades de tu negocio y la precisión que desees en tus datos.  A continuación, exploramos cada uno de estos modelos en detalle.

1. Data Blended (Mezclado)

El modelo Data Blended es la configuración predeterminada por defecto en GA4 (la que tienen todas las cuentas si no cambias su configuración) y combina los cuatro identificadores de usuario: User ID, Google Signals, ID de dispositivo y usuarios modelados. Este enfoque busca ofrecer la visión más completa posible del comportamiento del usuario, aprovechando todas las fuentes de datos disponibles.

Con Data Blended, puedes obtener informes enriquecidos que capturan las interacciones clave de tus usuarios, incluso cuando no han dado su consentimiento para el seguimiento tradicional. Esto es especialmente útil para negocios con un alto volumen de tráfico y diversas fuentes de adquisición, ya que permite optimizar la recolección de datos y construir informes detallados.

Sin embargo, este modelo, como veremos,  añade ruido y riesgos asociados a la estabilidad de los datos en los informes. Al incluir usuarios modelados, no siempre es posible determinar qué parte de la información es estimada y cuál es real. Esto puede afectar la confianza en los informes y accionables y complicar la toma de decisiones basadas en datos. No todo es oro, puede sonar muy tentador ir a por por el modelo de usuario que más datos nos da, pero debes entenderlo antes de decidir.

2. Observed (Observado)

El modelo Observed excluye a los usuarios modelados y utiliza únicamente el User ID, Google Signals y el ID de dispositivo. Este enfoque busca ofrecer datos más confiables al evitar estimaciones y basarse solo en información directamente observada.

Al utilizar Observed, puedes reducir el ruido asociado con los datos modelados. Esto es beneficioso si tu prioridad es obtener informes accionables basados en datos precisos y si tienes un porcentaje significativo de usuarios que permiten el seguimiento tradicional. Además, este modelo sigue aprovechando las ventajas del User ID y Google Signals para mejorar la granularidad y la organización de los eventos.

La limitación principal de Observed es que puede haber huecos en tus datos debido a los usuarios que no permiten el seguimiento. Esto puede resultar en una subestimación de ciertas métricas y afectar el análisis de tendencias y patrones de comportamiento. Es importante evaluar si la pérdida de datos es aceptable en el contexto de tus objetivos de negocio.

Otra debilidad es que al usar varios sistemas, en algunos entornos pueden probocarse inestabilidades o duplicidades en los usuarios. Por ejemplo, al estar un usuario en APP y Web a la vez Google podría tomar al usuario de Google Signals en la web y no en la App viendo por lo tanto 2 usuarios cuando solo había uno. De la misma forma un usuario podría usar User Id solo en su segunda visita y que lo viésemos como dos distintos. Hay casos y casos, pero si que existen escenarios donde no querras esta mezcla de tu usuarios en tus datos.

3. Device Only (Solo datos del dispositivo)

El modelo Device Only se basa exclusivamente en el ID de dispositivo, ya sea cookie en la web o Instance ID en aplicaciones móviles. Esta configuración está algo escondida en la interfaz de GA4 y requiere hacer un click en el botón de más opciones avanzadas para seleccionarla. Google nos deja claro que no es la opción que quiere que escojamos, pero eso no significa que no pueda ser la que deseamos.

La principal ventaja de Device Only es la pureza de los datos. Al no incluir User ID, Google Signals ni usuarios modelados, obtienes información sin interferencias ni estimaciones. Esto es ideal para análisis técnicos que requieren máxima precisión y donde es esencial respetar las limitaciones de cardinalidad.

Este modelo es similar a cómo funcionaba Universal Analytics y puede ser útil si deseas una comparabilidad directa con datos históricos recopilados en esa plataforma. Sin embargo, al depender únicamente del ID de dispositivo, te enfrentarás a las limitaciones asociadas, como la imposibilidad de unir sesiones de un mismo usuario a través de diferentes dispositivos o navegadores.

Cómo configurar el modelo de usuario en el Administrador de GA4

Modificar el modelo de identidad del usuario en GA4 es un proceso sencillo, pero debe realizarse con precaución debido a su impacto retroactivo en todos los datos históricos. A continuación, se detallan los pasos para acceder y cambiar esta configuración, asegurando una implementación eficiente y evitando sorpresas en tus informes.

Pasos para configurar el modelo de usuario:

1. Accede al Administrador de GA4: En tu panel de GA4, dirígete a la esquina inferior izquierda y haz clic en el ícono de «Administrador». Esto te llevará a la página de configuración de tus propiedades y cuentas.

2. Selecciona la propiedad correcta: Asegúrate de estar en la propiedad de GA4 donde deseas realizar el cambio. Esto es crucial para evitar modificar inadvertidamente la configuración en otra propiedad.

3. Haz clic en «Flujo de datos»: Dentro de la columna «Propiedad», selecciona «Flujo de datos». Aquí verás una lista de los flujos de datos asociados con tu propiedad, ya sea web o aplicación móvil.

4. Selecciona el flujo de datos correspondiente: Haz clic en el flujo de datos donde quieres cambiar el modelo de identidad del usuario.

5. Accede a «Configuración de etiquetas»: En la sección de detalles del flujo de datos, busca y haz clic en «Configuración de etiquetas» o «Configuración de colección de datos».

6. Selecciona «Configuración de identidad del usuario»: Dentro de esta sección, encontrarás la opción «Identidad del usuario». Al hacer clic, se desplegarán las opciones disponibles.

7. Elige el modelo de identidad: Aquí puedes seleccionar entre los modelos Data Blended (Mezclado) y Observed (Observado). Para acceder a Device Only (Solo dispositivo), deberás hacer clic en «Mostrar opciones avanzadas» o similar, ya que esta opción está algo escondida.

Consideraciones importantes sobre cambiar el modelo de identificación del usuario:

Impacto retroactivo: Al cambiar el modelo de identidad del usuario, todos los datos históricos se recalculan según la nueva configuración. Esto puede resultar en variaciones significativas en tus informes y métricas clave. Un solo click, y todos los datos que sueles reportar cambian, cuidado con eso.

Comunicación interna: Por lo anterior, antes de realizar el cambio, es fundamental informar a tu equipo y a cualquier persona que utilice los datos de GA4. Esto evita confusiones y asegura que todos estén al tanto de las razones detrás de las posibles discrepancias en los informes.

Análisis previo: Evalúa cuidadosamente cuál modelo se ajusta mejor a tus necesidades. Considera factores como el volumen de usuarios, las fuentes de tráfico y la importancia de la precisión en tus informes.

Restablecer la configuración original: Si realizas cambios temporales para análisis específicos, asegúrate de volver a la configuración original una vez que hayas terminado. Esto evita que otros usuarios se encuentren con datos inesperados.

Al seguir estos pasos  podrás ajustar el modelo de identidad del usuario de manera eficaz, y sobretodo evitarás «liarla parda».

IMPORTANTE: Cómo impacta el uso de usuarios modelados en los datos de GA4

La inclusión de usuarios modelados en tus informes de GA4 (que solo sucede con el modo data blended) puede tener un impacto significativo en la precisión y confiabilidad de tus datos. Si bien ofrece la ventaja de rellenar los vacíos dejados por usuarios que no permiten el seguimiento de cookies, también introduce desafíos que es importante entender y gestionar adecuadamente.

1. Incertidumbre en los datos: no saber cuántos datos están modelado

Uno de los principales problemas al utilizar el modelo Data Blended es que GA4 no proporciona información específica sobre qué porcentaje de tus datos proviene de usuarios modelados. Esto significa que al analizar métricas como el número de usuarios, sesiones o conversiones, no puedes determinar con exactitud cuánto de ese dato es real y cuánto es estimado.

Por ejemplo, podrías observar un incremento inesperado en el número de usuarios tras activarse el Data Blended. Sin información clara sobre el origen de este aumento, podrías interpretar erróneamente el rendimiento de tus campañas o el comportamiento del usuario. Esta incertidumbre dificulta la capacidad de tomar decisiones  y puede llevar a estrategias basadas en datos poco confiables. No serías el primero que por tráfico estimado cree que sus campañas han empezado a funcionar peor y decide arreglarlas.

Además, al no saber qué datos son modelados, es más complicado identificar y corregir posibles anomalías o incoherencias en tus informes. ¿Hemos perdido datos por un mal etiquetado o por que ha aumantado la cantidad de usaurios estimados? ¿O es que Google ha cambiado algo en sus cálculos?Todo esto puede afectar la confianza que tu equipo y las partes interesadas los datos , lo que subraya la importancia de tener mucho cuidado si usas este modelo. Nadie quiere que llegue ese temido momento en el que nos dicen «Eso dice Analytics, pero no nos lo creemos».

2. Inconsistencias entre distintos informes de GA4

Otro impacto significativo del uso de usuarios modelados es la aparición de inconsistencias entre diferentes informes dentro de GA4. Los datos modelados no se aplican uniformemente en todas las secciones e informes de la plataforma, lo que puede generar confusión y dificultar la interpretación de los resultados.

Por ejemplo, las audiencias y los segmentos pueden comportarse de manera diferente. Mientras que algunos segmentos personalizados pueden incluir usuarios modelados, las audiencias creadas para campañas de remarketing no los incorporan. Esto significa que podrías ver discrepancias en el tamaño y comportamiento de estos grupos, afectando la eficacia de tus campañas y la precisión de tus informes.

Informes específicos como Retención, LifeTime Value y métricas predictivas tampoco aplican datos modelados. Si no estás al tanto de estas limitaciones, podrías interpretar incorrectamente las tendencias o el rendimiento a largo plazo de tus usuarios, lo que impacta en la planificación estratégica y en la optimización de recursos.

Estos son todos los sitios de GA4 que no tienen nunca datos con usuarios modelados:

  • Audiencias: Si bien en un segmento con la misma configuración podrás ver usuarios sin cookies, las audiencias, que parten justo de las cookies, nunca los incluirán.
  • Exploraciones de usuarios, de cohortes y de LTV nunca incluyen a los usuarios modelados. Y por lo tanto difieren de otros informes.
  • Si tus exploraciones tienen segmentos, si incluyen usuarios modelados, pero si el segmento es de secuencias, dejarán de incluirlos.
  • Los informes de Retención, tampoco ofrecen estos datos.
  • Ninguna de las métricas predictivas (por ejemplo probabilidad de conversión) se calcula en base a los usuarios modelados, lo cual puede llevarte a errores si las aplicas para hacer estimaciones, sobre los usuarios básicos que si los incluyen.
  • BigQuery por supuesto, tampoco incluye datos modelados.
 

Más frustrante que los sitios donde si se aplican usuarios modelados y lso que no es el caso de los eventos de GA4 en si mismos:

  • Mientras que las métricas de Total usuarios, Total Sesiones y Usuarios nuevos si usan datos modelados (salvo en los casos anteriores) nos encontramos con que los eventos ligados a estas métricas a veces si se modelan y a veces no…
  • Cuando vayamos a crear exploraciones de tipo tabla, veremos que los datos no coinciden para nada entre eventos y métricas. Esto es porque eventos como first_visit, session_start o page_view no usan usaurios modelados y aparecen más pequeños, pero en cambio las métricas si los usan viendo otros totales. Si lo sabes, no pasa nada, pero la mayoría no saben este detalle.
  • Más aún cuando vamos a los informes de Embudo ahí si se modelan estos datos (¿alguien me lo explica?) y por lo tanto el total de evento session_start en un informe de embudo no es el mismo que en un informe de tabla.
 
Por último, algunos negocios que tienen un volumen de usuarios mediano(2.000-5000 usuarios al día) pueden ir viendo como sus usuarios modelados aparecen en temporada alta y desaparecen en temporada baja (por entrar y salir de la cuota minima de usuarios que necesita GA4 para trabajar estos datos), destrozando así las tendencias que estamos viendo.
  •  

Impacto del Data Blended en el canal directo y medios de pago push

El uso del modelo Data Blended puede influir notablemente en la atribución de canales, especialmente en el canal directo y en medios de pago push. Al incluir usuarios modelados, es común observar un incremento artificial en el tráfico atribuido al canal directo.

Esto ocurre porque, sin identificadores precisos, GA4 tiene dificultades para rastrear la fuente original de ciertos usuarios cuando realizan muchas sesiones en momentos y días distintos. Esto con cookies no es tán problemático porque cuando llegas sin información de campaña (directo) 10 días después de haber entrado por una campaña, GA4 sigue sabiendo que eres tu y te asigna esa campaña (Last Click Indirecto), pero en los usuarios modelados tiene muchas menos probabilidades de saber que es la misma persona.

Como resultado, asigna estas sesiones al canal directo, lo que al no ser el mismo comportamiento que tiene con las cookies, puede hacer crecer el peso de este canal.

En cuanto a los medios de pago push, como la publicidad display o campañas en redes sociales, el efecto puede ser el opuesto. Dado que estas campañas son bastante intrusivas y muchas veces se enfocan a usuarios nuevos, estos canales no es extraño que en ellas haya una mayor tasa de usuarios que no aceptan cookies. Como GA4 calcula sus datos en función de los datos que si que conoce (los que aceptan cookies) tiende a bajar el peso de estos canales al activar el modelado.

Y como estos hay muchos otros detalles fruto de la imperfecta asignación de usuarios de GA4. Que en global muchas veces no es importante nada de esto, pero no está de más validarlo para ver cual es tu caso.

Con todo esto, cómo decidir si necesitas el Data Blended en GA4

La elección de utilizar el modelo Data Blended debe basarse en una evaluación cuidadosa de las necesidades y características de tu negocio. No es una solución universal, y en algunos casos, podría introducir más complicaciones que beneficios y en otros ser la salvación que necesitas para los malditos gaps de las cookies. A continuación, se presentan factores clave que te ayudarán a determinar si este modelo es adecuado para ti.

Sí necesitas el Data Blended cuando…

Hay situaciones específicas en las que el uso del Data Blended puede ser altamente beneficioso para tu negocio. Si tu sitio o aplicación recibe un alto volumen de usuarios, específicamente más de 5,000 usuarios diarios, el Data Blended puede ser una opción adecuada. Un alto volumen de tráfico proporciona suficientes datos para que los algoritmos de modelado sean más precisos y útiles, permitiéndote obtener una visión más completa del comportamiento de los usuarios.

Además, si tu estrategia de adquisición depende en gran medida de campañas de marketing pagadas, especialmente en canales donde los usuarios pueden rechazar las cookies, el Data Blended ayuda a cubrir los gaps en los datos y a capturar las interacciones clave. Esto es crucial para mantener una visión precisa del rendimiento de tus campañas y optimizar tus inversiones en marketing.

Otro factor a considerar es la diversidad de tus fuentes de tráfico. En escenarios donde recibes tráfico de múltiples canales y dispositivos, el Data Blended puede ofrecer una visión más completa del comportamiento del usuario, optimizando la recolección de datos y permitiéndote tomar decisiones informadas. 

Finalmente, si es crítico para tu negocio tener informes detallados que incluyan todas las interacciones posibles, el Data Blended te permite construir una imagen más amplia, aunque con algunas limitaciones en la precisión.

No necesitas el Data Blended cuando…

Existen también situaciones en las que el uso del Data Blended puede no ser adecuado y, de hecho, introducir más complicaciones que beneficios. Por ejemplo, si tu organización depende de BigQuery como la fuente principal de datos para reportes y análisis avanzados, es importante saber que las exportaciones a BigQuery no incluyen datos modelados. Esto puede generar inconsistencias y confusión al comparar informes entre GA4 y BigQuery.

Si la mayoría de tu tráfico proviene de fuentes orgánicas y/o tienes un volumen de tráfico más modesto, el beneficio del Data Blended puede ser mínimo. En este caso, es preferible priorizar la precisión y la pureza de los datos, utilizando modelos que eviten la inclusión de datos modelados para mantener la integridad de los informes.

Además, si tu enfoque está en obtener datos exactos, aunque ello implique tener menos información sobre ciertos usuarios, los modelos Observed o Device Only pueden ser más adecuados. 

Finalmente, si no cuentas con un equipo dedicado a interpretar y gestionar las complejidades introducidas por los datos modelados, es más seguro optar por un modelo que ofrezca claridad y simplicidad, evitando así confusiones y errores en los análisis.

Obligado: Crea un protocolo para trabajar con datos modelados en GA4

Si decides utilizar el modelo Data Blended en GA4, es esencial establecer un protocolo que te ayude a gestionar las particularidades de los datos modelados. Esto garantiza que puedas aprovechar sus beneficios mientras minimizas los riesgos asociados a la incertidumbre y las inconsistencias.

1. Crear consciencia de la calidad de los datos en cada informe

La primera práctica recomendada es desarrollar una conciencia constante sobre la calidad de los datos que estás analizando. GA4 proporciona un icono de alerta de calidad en cada informe, que indica si se están utilizando datos modelados o si existen limitaciones en la información presentada.

Es importante que tú y tu equipo revisen este icono regularmente. Al elaborar informes, dashboards o presentaciones, incluye una nota que indique si los datos contienen información modelada. Esto no solo mejora la transparencia, sino que también ayuda a contextualizar los hallazgos y las conclusiones derivadas de los datos.

Además, fomenta una cultura en la que todos los miembros del equipo pregunten y verifiquen si los datos que están utilizando incluyen modelados. Esta práctica colectiva fortalece la confianza en los análisis y promueve decisiones más informadas.

2. Consistencia en los datos a lo largo del análisis

Mantener la consistencia en el uso de los datos es crucial para evitar confusiones y errores de interpretación. Evita mezclar datos observados y modelados en el mismo análisis o informe, ya que esto puede llevar a conclusiones erróneas.

Por ejemplo, si estás comparando el rendimiento de diferentes campañas, asegúrate de que todas las métricas provengan del mismo modelo de identidad. Esto implica mantener una parametrización adecuada y ser cuidadoso al seleccionar las fuentes de datos para tus informes.

Si necesitas trabajar con diferentes modelos por razones específicas, separa claramente los análisis y explica las diferencias a los destinatarios de los informes. Esta claridad ayuda a construir informes accionables y a optimizar la recolección de datos sin sacrificar la simplicidad.

3. Notificar a los usuarios antes de realizar cambios en el modelo de identidad

Al cambiar el modelo de identidad del usuario en GA4, es fundamental comunicar este cambio a todos los involucrados en el uso y análisis de los datos. Dado que los cambios son retroactivos y afectan a todos los datos históricos, una modificación sin previo aviso puede causar confusión y afectar la confianza en los informes.

Antes de realizar el cambio, envía una notificación a tu equipo y a cualquier parte interesada, explicando las razones y el impacto esperado. Esto permite que todos estén preparados y ajusten sus análisis y expectativas en consecuencia.

Una vez que hayas completado el análisis o ajuste necesario, es importante restablecer la configuración original si es aplicable. Documenta todos los cambios realizados y las fechas en que ocurrieron. Esta práctica facilita el seguimiento y ayuda a resolver cualquier discrepancia que pueda surgir en el futuro.

Soluciones: El Método de IKAUE para comparar los tres modelos de usuario en GA4 y decidir con datos

En IKAUE hemos desarrollado un método sencillo y eficaz para comparar cómo cada modelo de identidad del usuario afecta tus datos en GA4. Este enfoque te permite visualizar las diferencias y tomar decisiones informadas sobre cuál modelo se adapta mejor a tus necesidades.

La técnica de las tres pestañas para visualizar los modelos

El método consiste en utilizar tres pestañas del navegador para cargar el mismo informe en GA4, cada una configurada con un modelo de identidad diferente. Dado que los cambios en el modelo de usuario son retroactivos y afectan a todos los datos históricos, este enfoque te permite comparar directamente los resultados.

Pasos detallados:

1. Abre GA4 en una primera pestaña:

Asegúrate de que el modelo de identidad esté configurado en Data Blended (Mezclado), que es el predeterminado. Carga el informe que deseas analizar, por ejemplo, el informe de canales a nivel de sesión.

2. Abre una segunda pestaña y cambia el modelo a Observed (Observado):

Sin cerrar la primera pestaña, abre una nueva y accede al Administrador de GA4. Navega hasta la configuración de identidad del usuario y cambia el modelo a Observed. Vuelve al informe y cárgalo de nuevo. Ahora estás viendo los datos bajo el modelo Observed.

3. Abre una tercera pestaña y cambia el modelo a Device Only (Solo dispositivo):

Repite el proceso, esta vez seleccionando Device Only en las opciones avanzadas. Carga el mismo informe en esta pestaña.

4. Compara los datos entre las tres pestañas:

Observa las diferencias en métricas clave como usuarios, sesiones y nuevos usuarios. Analiza cómo varían los canales de adquisición y otras dimensiones relevantes.

Consideraciones importantes:

Comunicación interna: Como ya se ha dicho 2 veces antes, antes de realizar este ejercicio, informa a tu equipo para evitar que otros usuarios se encuentren con datos inesperados mientras trabajas.

Restablecer la configuración original: Una vez completado el análisis, vuelve a establecer el modelo de identidad que se utiliza normalmente en tu organización.

Este método te permite visualizar de manera inmediata el impacto de cada modelo en tus datos, facilitando la comprensión de cómo los usuarios modelados afectan tus informes. Además, te ayuda a estructurar los datos de manera que sean fáciles de analizar y a capturar las interacciones clave con mayor precisión.

Ejemplo: Análisis a nivel de canales y otros informes

La estrategia de las tres pestañas puede aplicarse a diversos informes y dimensiones dentro de GA4, lo que te permite profundizar en áreas específicas de interés para tu negocio.

Aplicaciones prácticas:

Al comparar los modelos, puedes identificar cómo varía el tráfico en cada canal. Por ejemplo, el canal directo puede mostrar incrementos significativos en el modelo Data Blended debido a la asignación de usuarios modelados. Esto te permite entender mejor cómo se distribuye el tráfico y ajustar tus estrategias de marketing en consecuencia.

En los funnels de conversión, puedes observar cómo cada modelo afecta las tasas de conversión en tu embudo de ventas. Esto es esencial para optimizar la experiencia del usuario y mejorar la eficacia de tus estrategias de conversión. Asimismo, al evaluar la segmentación de usuarios, puedes determinar la efectividad de tus segmentos personalizados y cómo se ven afectados por la inclusión o exclusión de usuarios modelados.

Además, puedes analizar cómo varía el comportamiento del usuario según el dispositivo o la ubicación geográfica, lo que puede informar decisiones sobre diseño responsivo o estrategias de mercado locales. Este enfoque integral te proporciona una visión más completa y te ayuda a construir informes detallados que reflejen con mayor precisión el comportamiento de tus usuarios.

Mejóralo: Descarga y análiza detalladamente de datos

Para llevar el análisis un paso más allá, puedes descargar los datos de cada modelo y realizar comparaciones detalladas en herramientas como Google Sheets o Excel. Esto te permite calcular porcentajes de cambio, identificar tendencias y documentar incidencias de manera más precisa.

Pasos para un análisis avanzado:

1. Descarga los datos de cada modelo:

En cada pestaña con el modelo de identidad correspondiente, utiliza la opción de exportar datos para descargar los informes.

2. Importa los datos a tu herramienta de análisis:

Crea una hoja de cálculo donde puedas organizar y comparar los datos de manera estructurada.

3. Calcula las variaciones entre modelos:

Utiliza fórmulas para calcular las diferencias y porcentajes de cambio entre los modelos. Visualiza estas variaciones mediante gráficos o tablas para facilitar la interpretación. Vamos, ¡hazlo tuyo!

4. Documenta las incidencias:

Registra cualquier discrepancia significativa y analiza las posibles causas. Esto puede incluir variaciones en canales específicos, cambios en tasas de conversión o fluctuaciones en el comportamiento del usuario.

Beneficios de este enfoque:

Al tener un análisis detallado, puedes tomar decisiones informadas con mayor confianza. Identificarás áreas donde puedes mejorar la configuración de GA4, ajustar tus estrategias de consentimiento o focalizar tus esfuerzos de marketing. Además, al documentar y compartir tus hallazgos, ayudas a alinear a todos los miembros en torno a una comprensión común de los datos y sus implicaciones.

Conclusión: maximizar la precisión en GA4 con un uso adecuado de los modelos de usuario

La elección y gestión del modelo de identidad del usuario en Google Analytics 4 es un aspecto crítico para obtener datos fiables y construir informes detallados. Cada modelo—Data Blended, Observed y Device Only—ofrece ventajas y desafíos que deben ser cuidadosamente evaluados en el contexto de las necesidades y objetivos de tu negocio.

Comprender las implicaciones de utilizar usuarios modelados es esencial para estructurar los datos de manera que sean fáciles de analizar. Si bien el Data Blended puede proporcionar una visión más completa al capturar las interacciones clave de usuarios que no permiten el seguimiento tradicional, también introduce incertidumbre y posibles inconsistencias en tus informes.GA4 ya es bastante complejo, asegúrate de que puedes lidiar con ello antes de añadirle complejidad.

Al implementar prácticas como crear conciencia sobre la calidad de los datos, mantener la consistencia en el análisis y comunicar los cambios en el modelo de identidad, puedes minimizar los riesgos asociados y optimizar la recolección de datos. El método de IKAUE para comparar los tres modelos te ofrece una herramienta eficaz para visualizar y entender el impacto de cada opción, permitiéndote equilibrar entre granularidad y simplicidad.

En última instancia, la clave está en adaptar tu estrategia de analítica a las características únicas de tu audiencia y tus objetivos de negocio. Al hacerlo, estarás mejor posicionado para tomar decisiones informadas, aprovechar las oportunidades del mercado y construir una ventaja competitiva sostenible.

Iñaki Huerta
CEO de IKAUE

Director de IKAUE. Analista Digital y SEO hace más de 15 años. Internet Lover, Creador de Hilillos y DataHacker.

Iñaki Huerta Profile Picture

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

IKAUE MARKETING ONLINE, S.L. es la Responsable del Tratamiento de tus datos, con la finalidad de moderar y publicar tu comentario con tu nombre (en ningún caso se publicará tu correo electrónico). Tienes derecho de acceso, rectificación, supresión, limitación, oposición al tratamiento y portabilidad. Puedes ejercitar tus derechos en [email protected]. Más información en la Política de privacidad.

También te puede interesar

¡Suscríbete!

RECIBE NUESTRA NEWSLETTER

Registrar nueva cuenta

IKAUE MARKETING ONLINE, S.L. es la Responsable del Tratamiento de tus datos, con la finalidad de gestionar tu registro y remitirte nuestra Newsletter con las últimas novedades y/o promociones. Tienes derecho de acceso, rectificación, supresión, limitación, oposición al tratamiento y portabilidad. Puedes ejercitar tus derechos [email protected]. Más información en la Política de privacidad.