En el mundo del SEO, cuando manejas un sitio web con miles o incluso millones de URLs, uno de los principales retos es obtener una visión clara de lo que realmente está ocurriendo en tu negocio. La sobrecarga de datos puede entorpecer el análisis, dificultando la identificación de patrones, tendencias y áreas problemáticas. La clusterización de URLs se convierte, por tanto, en una herramienta esencial. En IKAUE la aplicamos en absolutamente todos nuestros proyectos y es prácticamente uno de los primeros pasos que damos en auditorías y análisis.
Clusterizar URLs significa agruparlas en categorías específicas, lo que te permite analizar de manera más efectiva las métricas clave como impresiones, clics, sesiones, leads y ventas. Sin esta agrupación, corres el riesgo de perderte en los detalles y no ver el panorama general que podría estar marcando el éxito o el fracaso de tu estrategia SEO.
El punto clave aquí es que, sin una estructura organizada para gestionar tus URLs, estarás navegando a ciegas. Imagina tratar de analizar el rendimiento SEO sin saber si estás viendo una página de producto, una entrada de blog, o una página corporativa; la confusión podría llevarte a tomar decisiones incorrectas. Desde nuestra experiencia, al aplicar clusterización logramos no solo simplificar el análisis, sino también mejorar la capacidad de respuesta a cambios de tráfico incidencias y a la repriorización de proyectos.
En definitiva, clusterizando entenderás mejor tu negocio y lo harás más rápido.
¿Qué entendemos por clusterización de URLs?
Clusterizar, en el contexto de SEO, se refiere a la práctica de agrupar URLs bajo un conjunto de criterios comunes para analizarlas por grupos en lugar de individualmente. Este enfoque te permite manejar grandes volúmenes de datos de manera organizada, facilitando el seguimiento de métricas clave. En lugar de observar cada URL de manera aislada, las agrupas en clusters según su propósito o categoría dentro del sitio, como páginas de producto, categorías, entradas de blog, entre otras. Este proceso no solo simplifica el análisis, sino que también revela insights que serían difíciles de detectar al examinar URLs individuales.
El objetivo principal al clusterizar URLs es obtener una visión macro de cómo se distribuyen y se comportan diferentes segmentos de tu sitio web en términos de SEO. Esto te permite, por ejemplo, identificar rápidamente si las páginas de producto están generando suficientes impresiones o si el blog está atrayendo el tráfico esperado. Este enfoque también facilita la comparación entre diferentes clusters, ayudándote a identificar fortalezas y debilidades en tu estrategia SEO.
Otro aspecto que no puedes pasar por alto es la flexibilidad que ofrece la clusterización. Puedes ajustar tus clusters según las necesidades cambiantes de tu análisis SEO, lo que te da la agilidad necesaria para responder a nuevas preguntas o problemas que puedan surgir en tu negocio.
¿Qué buscamos al clusterizar URLs?
Buscamos ver de un solo vistazo cómo se distribuyen y comportan métricas como impresiones, clics, sesiones, leads y ventas a lo largo de diferentes segmentos de nuestro sitio. Esta agrupación nos permite entender mejor cuáles son las áreas que están funcionando bien y cuáles requieren atención, lo que es crucial para tomar decisiones informadas y mejorar la eficiencia de tu estrategia SEO.
Para maximizar tus posibilidades de éxito en SEO, necesitas una forma estructurada de interpretar los datos. La clusterización te ofrece justo eso: una estructura que organiza y simplifica la visualización de tus métricas clave. Esto es especialmente útil cuando se trata de identificar patrones en la interacción de los usuarios con diferentes tipos de contenido. Por ejemplo, si notas que tus páginas de producto tienen menos impresiones pero un alto número de clics, puedes deducir que la visibilidad es un área de mejora, mientras que la conversión está funcionando correctamente.
En resumen, lo que realmente importa es poder interpretar el rendimiento de tu sitio de manera integral, y la clusterización de URLs es la herramienta que te permitirá hacerlo de manera efectiva. Este enfoque no solo mejora tu capacidad de análisis, sino que también te ayuda a priorizar las áreas más importantes para tu negocio.
Análisis concretos que podremos realizar con clusters de URLs
La clusterización de URLs no solo es útil para organizar y analizar datos, sino que también se convierte en una herramienta indispensable para realizar análisis específicos en diferentes contextos de SEO. En Ikaue, aplicamos esta técnica en una variedad de situaciones para optimizar nuestro enfoque y obtener insights más precisos. A continuación, te presentamos algunos ejemplos concretos de cómo utilizamos la clusterización en nuestros proyectos:
En el análisis inicial de un proyecto o auditoría
Cuando iniciamos un nuevo proyecto o realizamos una auditoría SEO, una de nuestras primeras acciones es mostrar el total de URLs, clics y conversiones por grupo. Esto nos proporciona una visión clara de los pesos y la distribución del negocio, permitiéndonos identificar rápidamente las áreas más críticas y las oportunidades de optimización.
Por ejemplo, en un ecommerce de zapatos, podríamos encontrar clusters para «páginas de categoría», «páginas de producto», «blog» y «páginas de información corporativa». Al observar los clics y conversiones por cada grupo, podríamos descubrir que las páginas de categoría generan muchas impresiones pero pocas conversiones, lo que nos indicaría un posible problema en la navegación o en la llamada a la acción en esas páginas.
Al analizar problemas de crawling o indexación
Los problemas de crawling e indexación nunca afectan de manera uniforme a todo el sitio. Por lo general, impactan más a unas zonas que a otras. Al aplicar la clusterización de URLs, podemos identificar con mayor precisión qué partes del sitio están siendo afectadas, lo que facilita la implementación de soluciones específicas.
Un ejemplo sería un sitio de clasificados de cursos online. Al clusterizar las URLs en «páginas de listado de cursos», «detalles del curso», y «páginas de categorías», podríamos detectar que las «páginas de detalles de cursos» tienen problemas de indexación mientras que las otras se rastrean correctamente. Esto podría indicar problemas técnicos específicos en esa parte del sitio, como una configuración errónea del archivo robots.txt o un error en las etiquetas de indexación.
Para ver problemas de duplicidad y thin content
La duplicidad de contenido y el thin content son problemas que pueden afectar gravemente al posicionamiento de un sitio. La clusterización nos permite priorizar la resolución de estos problemas por bloques en lugar de hacerlo URL por URL, lo que hace el proceso mucho más eficiente y manejable.
En un ecommerce que ofrece diferentes tipos de productos, como ropa y accesorios, podríamos crear clusters para «páginas de productos», «páginas de categorías» y «páginas de contenido informativo». Si identificamos que las «páginas de productos» tienen un alto índice de duplicidad debido a descripciones repetidas o que el contenido es escaso en algunas categorías, podríamos priorizar la creación de contenido único y más detallado para esas páginas, mejorando así el rendimiento de todo el sitio.
Para entender el crawl budget del negocio
El crawl budget es un recurso valioso que debemos gestionar cuidadosamente. Al analizar el porcentaje de URLs rastreadas por grupo, podemos obtener una mejor comprensión de dónde Google está invirtiendo su tiempo y, lo más importante, identificar las áreas que están siendo sub-rastreada y entender por qué.
Imagina un portal de noticias con miles de artículos publicados. Al clusterizar las URLs en «noticias recientes», «artículos de archivo», y «páginas de opinión», podríamos observar que Google está gastando demasiado presupuesto de rastreo en los «artículos de archivo», dejando menos recursos para las «noticias recientes», que son las que realmente necesitan ser rastreadas con mayor frecuencia. Esto indicaría la necesidad de ajustar nuestras directrices de rastreo para priorizar mejor el contenido más relevante.
Para evaluar caídas y core updates
Los core updates de Google a menudo tienen efectos variados en diferentes partes de un sitio web. En lugar de mirar el tráfico global, dividirlo en clusters nos permite ver con mayor claridad qué áreas están siendo impactadas positivamente o negativamente. Incluso si todo el sitio parece ir en la misma dirección, esta técnica puede revelar problemas subyacentes o proporcionar insights valiosos sobre el comportamiento del algoritmo.
Por ejemplo, en un sitio web de reservas de hoteles, podríamos crear clusters para «páginas de destino», «páginas de hoteles individuales» y «páginas de categorías». Tras un core update, podríamos notar que las «páginas de destino» han perdido tráfico mientras que las «páginas de hoteles individuales» han mejorado. Este tipo de análisis detallado nos permitiría entender mejor qué áreas del sitio han sido favorecidas o penalizadas por la actualización y ajustar nuestra estrategia en consecuencia.
Para entender el efecto de optimizaciones propuestas o realizar A/B testing SEO
En nuestros experimentos de SEO, como las pruebas A/B, creamos clusters específicos para separar las URLs que han sido modificadas de las que permanecen sin cambios. Esto nos ayuda a observar el efecto global de las optimizaciones realizadas y a tomar decisiones basadas en datos concretos.
Consideremos un sitio de clasificados de coches que realiza cambios en las páginas de detalle de los vehículos para mejorar la tasa de conversión. Al clusterizar estas páginas en «páginas con optimización» y «páginas sin optimización», podríamos medir con precisión el impacto de las mejoras, observando si las páginas optimizadas muestran un aumento en conversiones en comparación con el grupo de control.
Para entender mejor los efectos del linkbuilding
En nuestras estrategias de linkbuilding, la clusterización nos permite separar las URLs en diferentes categorías: aquellas que están en campaña, relacionadas con la campaña, y las que están aisladas de ella. Esto nos proporciona una visión más clara del valor de los links creados y su impacto en el SEO global del sitio.
Un caso práctico sería una campaña de linkbuilding para un blog de tecnología. Al clusterizar las URLs en «artículos promocionados», «artículos relacionados» y «otros artículos», podríamos ver cómo los enlaces externos están afectando el rendimiento de cada grupo. Si observamos que los «artículos promocionados» están aumentando en visibilidad y tráfico, mientras que los «otros artículos» no, podríamos inferir que la campaña está logrando su objetivo de posicionar mejor los contenidos promocionados.
Y en todo lo que quieras
Como ves, esta clusterización es capaz de darte información importante en casincualquier escenario de análisis. Te permitirá salir del dato global sin llegar al granular.
¿Cómo clusterizamos URLs? Expresiones regulares y su implementación
Aunque existen sistemas de autoclusterización basados en encontrar patrones entre el detalle de los datos, normalmente las primeras clusterizaciones de URLs se realizan mediante el uso de expresiones regulares (regex), una herramienta poderosa para definir patrones de búsqueda que clasifican tus URLs en diferentes categorías o clusters. Las expresiones regulares te permiten crear reglas precisas que identifican qué URLs pertenecen a cada grupo, asegurando que cada cluster sea lo más exacto y representativo posible del negocio.
Para aplicar la clusterización, primero debes definir una serie de reglas ordenadas que clasifiquen tus URLs de forma jerárquica. Es fundamental que el orden de estas reglas vaya de lo más específico a lo más general. Por ejemplo, si tienes una regla que identifica páginas de producto y otra que identifica páginas de categoría, la primera debe ser más específica que la segunda, asegurando que cada URL sea validada en la secuencia correcta. Este enfoque evita errores y asegura que cada URL termine en el cluster adecuado.
Aquí te dejamos un ejemplo de una lista de reglas regex para un sitio web ficcticio (uno especialmente fácil de clusterizar, si, pero es para que se entienda mejor):
- Homepage: ^/$
- List: ^/category/.*
- Product: ^/product/.*
- Blog: ^/blog/.*
- Corporate page: ^/about/.*
- Search result: ^/search/.*
- Other: .*
Estas expresiones te permitirán agrupar tus URLs de manera eficiente, facilitando el análisis de cada grupo según las métricas que más te interesen.
Aspectos a tener en cuenta al crear tus reglas de clusterización
Al crear tus reglas de clusterización, es esencial que sean lo más exactas posibles. Cada regla debe estar diseñada para capturar un segmento específico de tu negocio, de manera que cada cluster represente claramente una parte del sitio. Este enfoque asegura que los datos sean fiables y que cada cluster ofrezca insights precisos sobre su categoría correspondiente.
Uno de los errores comunes que debes evitar es crear reglas demasiado generales o ambiguas, ya que esto podría resultar en una clasificación incorrecta de URLs. Asegúrate de que cada regla esté bien definida y se enfoque en una parcela clara y representativa del negocio. Por ejemplo, una regla para páginas de producto debe ser capaz de identificar todas las variantes de URLs que podrían corresponder a productos, sin mezclar otros tipos de páginas.
El orden de las reglas es otro aspecto crucial. Las reglas más específicas deben estar al principio, seguidas por las más generales. Esto es importante porque, al aplicar las reglas, cada URL se validará con la primera regla; si no coincide, pasará a la siguiente, y así sucesivamente. Este proceso garantiza que cada URL se clasifique correctamente en el cluster que mejor la representa.
¿Dónde podemos aplicar la clusterización de URLs?
La clusterización de URLs es una técnica versátil que puede aplicarse en casi cualquier tecnología que gestione datos. A continuación, te presentamos algunas de las opciones más comunes:
- Hojas de cálculo: Utilizando funciones avanzadas como IFS en Google Sheets o Excel.
- SQL: Implementando la clusterización mediante la función CASE en consultas SQL.
- JavaScript: Usando estructuras condicionales como switch para clasificar URLs en herramientas como Google Tag Manager o Node.js.
- Looker Studio: Empleando la función CASE para crear clusters dentro de informes personalizados.
- Python: Utilizando expresiones regulares en scripts para procesar y clasificar URLs.
- PHP: Aplicando regex en código PHP para categorizar URLs.
- Java: Implementando lógica de clusterización en aplicaciones Java mediante regex y estructuras condicionales.
Cada una de estas tecnologías ofrece distintas ventajas según el contexto en el que las utilices. La elección de la herramienta depende de tus necesidades específicas, pero lo importante es que la clusterización de URLs se puede integrar en cualquier entorno que requiera análisis de datos SEO.
Ejemplo de clusterización de URLs en Google Sheets
Una de las maneras más sencillas de comenzar a clusterizar URLs es utilizando Google Sheets. La función IFS es perfecta para este propósito. Aquí te dejamos un ejemplo sencillo de cómo podrías implementar la clusterización de URLs en Google Sheets:
Google Sheets:
=IFS(
REGEXMATCH(A2, "^/$"), "Homepage",
REGEXMATCH(A2, "^/category/.*"), "List",
REGEXMATCH(A2, "^/product/.*"), "Product",
REGEXMATCH(A2, "^/blog/.*"), "Blog",
REGEXMATCH(A2, "^/about/.*"), "Corporate page",
REGEXMATCH(A2, "^/search/.*"), "Search result",
1, 'Other'
)
Ejemplo de clusterización de URLs con SQL
Si prefieres trabajar con bases de datos, SQL es una excelente opción para implementar la clusterización de URLs. A continuación, te mostramos cómo podrías hacerlo utilizando la función CASE:
SQL:
SELECT
CASE
WHEN url REGEXP '^/$' THEN 'Homepage'
WHEN url REGEXP '^/category/.*' THEN 'List'
WHEN url REGEXP '^/product/.*' THEN 'Product'
WHEN url REGEXP '^/blog/.*' THEN 'Blog'
WHEN url REGEXP '^/about/.*' THEN 'Corporate page'
WHEN url REGEXP '^/search/.*' THEN 'Search result'
ELSE 'Other'
END AS url_cluster
FROM your_table;
Ejemplo de clusterización de URLs con JavaScript
La clusterización de URLs también puede implementarse en JavaScript, ya sea para su uso en Google Tag Manager o Node.js. Aquí tienes un ejemplo utilizando la estructura switch:
JavaScript:
function categorizeURL(url) {
switch (true) {
case /^\/$/.test(url):
return 'Homepage';
case /^\/category\/.*/.test(url):
return 'List';
case /^\/product\/.*/.test(url):
return 'Product';
case /^\/blog\/.*/.test(url):
return 'Blog';
case /^\/about\/.*/.test(url):
return 'Corporate page';
case /^\/search\/.*/.test(url):
return 'Search result';
default:
return 'Other';
}
}
Ejemplo de clusterización de URLs en Looker Studio
Looker Studio (anteriormente Data Studio) es otra herramienta poderosa donde puedes implementar la clusterización de URLs utilizando la función CASE. Aquí tienes un ejemplo:
Looker Studio:
CASE
WHEN REGEXP_MATCH(url, "^/$") THEN "Homepage"
WHEN REGEXP_MATCH(url, "^/category/.*") THEN "List"
WHEN REGEXP_MATCH(url, "^/product/.*") THEN "Product"
WHEN REGEXP_MATCH(url, "^/blog/.*") THEN "Blog"
WHEN REGEXP_MATCH(url, "^/about/.*") THEN "Corporate page"
WHEN REGEXP_MATCH(url, "^/search/.*") THEN "Search result"
ELSE "Other"
END
Ejemplo de clusterización de URLs con Python
Python es ideal para automatizar procesos y manejar grandes volúmenes de datos. Aquí te mostramos cómo podrías realizar la clusterización de URLs en Python:
Python:
import re
def categorize_url(url):
if re.match(r'^/$', url):
return 'Homepage'
elif re.match(r'^/category/.*', url):
return 'List'
elif re.match(r'^/product/.*', url):
return 'Product'
elif re.match(r'^/blog/.*', url):
return 'Blog'
elif re.match(r'^/about/.*', url):
return 'Corporate page'
elif re.match(r'^/search/.*', url):
return 'Search result'
else:
return 'Other'
Ejemplo de clusterización de URLs con PHP
En entornos donde PHP es el lenguaje predominante, también puedes aplicar la clusterización de URLs. Aquí te dejamos un ejemplo sencillo:
PHP:
function categorizeURL($url) {
if (preg_match('/^\/$/', $url)) {
return 'Homepage';
} elseif (preg_match('/^\/category\/.*/', $url)) {
return 'List';
} elseif (preg_match('/^\/product\/.*/', $url)) {
return 'Product';
} elseif (preg_match('/^\/blog\/.*/', $url)) {
return 'Blog';
} elseif (preg_match('/^\/about\/.*/', $url)) {
return 'Corporate page';
} elseif (preg_match('/^\/search\/.*/', $url)) {
return 'Search result';
} else {
return 'Other';
}
}
Ejemplo de clusterización de URLs con Java
Para entornos donde Java es la tecnología principal, aquí tienes un ejemplo de cómo podrías implementar la clusterización de URLs:
Java:
import java.util.regex.*;
public class URLCategorizer {
public static String categorizeURL(String url) {
if (url.matches("^/$")) {
return "Homepage";
} else if (url.matches("^/category/.*")) {
return "List";
} else if (url.matches("^/product/.*")) {
return "Product";
} else if (url.matches("^/blog/.*")) {
return "Blog";
} else if (url.matches("^/about/.*")) {
return "Corporate page";
} else if (url.matches("^/search/.*")) {
return "Search result";
} else {
return "Other";
}
}
}
¿Necesitas ayuda para crear tus clusters? ¡ChatGPT al rescate!
Por eso, hemos creado un pequeño CustomGPT de chatGPT. Una herramienta sencilla que te permitirá ir definiendo cada grupo paso a paso en base a tus definiciones o a ejemplos de URLs de tu negocio. El chat te guiará paso a paso para crear cada grupo, te hará preguntas importantes para asegurarse de que las regex que crea son válidas y finalmente te permitirá crear códigos para cualquier lenguaje o herramienta en base a la lista que conjuntamente hayáis creado.