La Coocurrencia SEO: cómo utilizarla a tu favor y entender cómo Google analiza tus textos

Hasta la aparición de OpenAI, Google fue la empresa más visible en temas de IA Machine Learning orientada a textos. A fin de cuentas es el buscador más usado del mundo (y con diferencia) y mantiene su liderazgo en parte por todo lo que ha avanzado en tratamiento semántico y comprensión del lenguaje. Pero, en esencia, Google Search es una máquina que transforma nuestro lenguaje y necesidades en fórmulas y números. Aunque a menudo nos impresionan sus resultados, detrás de cada búsqueda hay una serie de procesos matemáticos que intentan interpretar nuestras intenciones de búsqueda. Los profesionales del SEO, en nuestro intento de entender este proceso, recurrimos a técnicas como TF-IDF o word2vec, que aunque no sean el centro de todas las estrategias, nos ayudan a entender mejor cómo funciona Google.

Uno de los conceptos fundamentales para parte de estos análisis es la coocurrencia. Esta técnica permite que los algoritmos detecten patrones entre palabras relacionadas y ayuda a los SEO a comprender mejor las relaciones semánticas entre términos y semánticas. En este post, exploraremos cómo la coocurrencia puede ser una herramienta valiosa para mejorar el rendimiento SEO, cómo se puede calcular y qué usos tiene para profesionales del SEO y desarrolladores.

¿Qué es la coocurrencia?

El término coocurrencia se refiere a la frecuencia con la que dos elementos aparecen juntos en un mismo contexto. Cuanto más frecuente es la aparición conjunta de estos dos elementos, más probable es que estos estén relacionados de una u otra forma, por lo que midiendo la coocurrencia entre elementos nos aproximamos a explicar esta relación entre elementos individuales. Este concepto normalmente se aplica al análisis semántico donde estos «elementos» a analizar son palabras o expresiones y el contexto es un conjunto de textos al que llamamos «corpus». Sin embargo debes tener en cuenta que  la coocurrencia puede aplicarse en muchos tipos de contexto distintos.

Por buscar un ejemplo que se salga totalmente de lo común y te ayude a tender qué es y para qué sirve la coocurrencia vamos a pensar en un escenario más mundano. Tu eres una persona sociable (al igual estoy suponiendo mucho 😉, pero vamos a suponerlo) y como tal, vas quedando y pasando tu tiempo con distintas personas para salir a cenar, a tomar algo o a bailar, etc. Así que para distintas situaciones de tu vida quedas con personas distintas. En ese contexto de «salidas que haces», las «personas» podrían ser los elementos que analizas y para entender las relaciones podrías usar la coocurrencia:

Tu y un amigo/a tuyo tenéis una coocurrencia igual al numero de veces o minutos que coincidís en el tiempo en el mismo sitio. Así que tienes más alta coocurrencia con la gente que pasas más tiempo. A poco que lo pienses te darás cuenta de que las personas con las que más coocurrencia tendrás van a ser seguramente tu grupo intimo. A su alrededor aparecerán las personas a las que te une algo importante. Coocurrencia no supondrá amistad, pero si medirá la relación y el tiempo compartido.

Por lo tanto podremos extrapolar (y ahí está la clave) que te pareces en personalidad o gustos a las personas con las que más coocurrencia tienes. Individualmente no será cierto, pero en conjunto tu grupo de contactos más asiduos irá marcando tus intereses y afinidades. Incluso, con estos datos, podremos hacer ese ejercicio con todo tu grupo de amistades para detectar grupos de personas afines y por lo tanto parecidas entre ellas. Mediremos la relación uno a uno de todos y surgirán si o sí, subgrupos y personas con alta y baja coocurrencia. Y al final, descubriremos mucho sobre cómo os relacionáis entre vosotros. Esta guay, ¿no? Si, es algo analítico y matemático, pero te acerca a saber más de muchas cosas.

Así que podemos concluir que la coocurrencia te permite extraer relaciones entre elementos y a partir de ellas entender mejor este ecosistema. Aplicada a los textos y la semántica de los contenidos web la coocurrencia nos hablarán de la relación que existe entre las palabras. ¿Cuán parecidas son las palabras «SEO» y «buscadores»? Pues si analizamos multitud de textos (el contexto o corpus) veremos que en los que encuentro la palabra SEO, casi siempre está también la palabra «buscador» o «buscadores» (tienen altísima coocurrencia) y de ahí puedo extrapolar que sus significados están muy atados. Incluso un ejercicio de este tipo a gran escala seguramente me ayudará a comprender que el SEO se puede definir como las palabras con las que más coocurrencia tiene: «optimización», «visibilidad», «Google», «buscadores»; «posicionamiento», «marketing», «tráfico», etc.

En el mundo del SEO, el estudio de la coocurrencia tiene varios usos. Ayuda a identificar qué palabras suelen aparecer juntas en un corpus de contenido, lo que permite comprender mejor la relevancia y las relaciones semánticas entre términos. Esto se aplica tanto para optimizar contenido como para detectar tendencias y patrones de búsqueda. Asimismo, en estrategias de linkbuilding, la coocurrencia puede ayudar a identificar sitios con enlaces compartidos (vecindarios), lo que ayuda a evitar enlaces tóxicos de sitios penalizados por Google.

El corpus: qué es y por qué es tan importante

El corpus (el conjunto total de elementos analizados), es esencial para cualquier análisis de coocurrencia. Es el contexto en el que esta se basa todo el análisis que realizas. En un análisis de texto el corpus serían todos los documentos que analizas. En uno literario podrían ser todos los libros de un autor o editorial y en nuestro ejemplo anterior sería el registro de todas interacciones que tienes con tus amigos en tus salidas o igual todas las entradas que apuntaste en un año en tu agenda.

El corpus es importante porque marca tanto la calidad como la especialización del análisis que estás realizando:

  • Si el corpus es demasiado pequeño o parcial, probablemente la coocurrencia que saques de ahí no será representativa de la realidad que tu quieres visualizar.

    Si para analizar un lenguaje solo tienes en cuenta unos pocos posts, diíicilmente verás todos los estilos ideas y vocabulario del lenguaje. En nuestro ejemplo sobre la amistad, imagina que para saber como te relacionas con tus conocidos solo tienes en cuenta lo que te sucede en un día concreto de tu vida. Eso puede no representar ni de lejos toda la gente con la que te alineas más.

  • La selección del corpus afecta a lo especializado que está tu análisis. De la misma forma, los elementos que escoges marcan lo viciado o especializado que está tu análisis.

    Esto puede ser intencionado o no. Lo importante es que lo tengas en cuenta y no te encuentres con un análisis que solo te da una visión sesgada sin tu haber buscado ese sesgo.

    Por ejemplo, antes decíamos de usar como corpus todos los libros de un autor determinado. Esto puede ser bueno si tu análisis se centra en ese autor, pues podrás entender las singularidades de cómo se expresa en sus libros. Pero puede ser muy contraproducente si no tienes en cuenta esto y te crees que esos libros representan como se expresan por ejemplo tus amistades. O imagina que para entender todas tus relaciones solo analizases las que suceden en tu horario laboral… Probablemente eso no refleje cuales son tus amistades reales. Sí, el análisis laboral podría ser muy útil para detectar núcleos y comunidades que se forman por si solas en una gran empresa, pero no va a representar a tus amistades más cercanas salvo que seas un auténtico workaholic.

 

En definitiva, un corpus debe representar con suficiente volumen el grupo completo que quieras analizar. Y ahí cada uno tendreemos nuestros recursos y vamos a ver como por mucho que lo deseemos a veces no tenemos el corpus que nos gustaría tener.

¿Con qué tamaño de corpus se trabaja?

Cuando analizamos textos el, corpus total (todo el contenido escrito del mundo), es inalcanzable, pero por suerte no es necesario analizar todos y cada uno de los contenidos del mundo para saber cómo escriben «la mayoría» de las personas. Por lo general a mayor cantidad de documentos o elementos en un corpus mayor calidad de lo que sacamos de este, pero llegados a cierto punto, los datos ya llegan a tal calidad que no cambiarán por meterle más y más datos. 

Como decíamos, cada uno tiene sus recursos y algunos tienen muchos más recursos que otros.

Pensemos en SEO y en el omnipresente Google. El señor Google tiene acceso a un corpus masivo: todo el Internet que ha rastreado queda a su alcance para sus análisis. Esto le permite detectar patrones y relaciones entre palabras a una escala que es imposible de replicar para la mayoría de las empresas. Con esa cantidad de datos, cualquier análisis sobre un lenguaje se vuelve global. En situación parecida estarían otras herramientas basadas en el análisis semántico. Aquí entrarían los LLM que tan de moda están como chatGPT y parecidos, otros buscadores como Bing y las grandes empresas de análisis o universidades.

El siguiente nivel de potencia tendríamos aplicaciones más comedidas pero aún con bastante músculo. En este estádio se trabaja con los cientos de miles de documentos que generan o a los que tienen acceso las grandes empresas. Un material que no es tan global, pero si suficiente como para desarrollar modelos y análisis muy potentes (y vuelvo a remitirme a los LLM para que se entienda de lo que hablo al hablar de potencia).

Justo por debajo disponemos de colecciones de corpus públicos que existen abiertas como el famoso  Common Crawl donde puedes descargar sus textos para empezar a trabajar con grandes cantidades de datos (de hecho esta fuente de datos es con la que empiezan muchos LLMs para generarse). Eso es accesible para todos y los datos están ahí, pero cuando los tengas te enfrentarás a otro problema: no siempre es rentable trabajar con toda esa brutalidad de datos. Solo lo será si te lo vas a tomar muy muy en serio.

Por último, estaría la opción de optar por corpus mucho más pequeños y especializados donde tu mismo te haces tu propia base de datos de documentos más o menos grande para el caso que deseas analizar. Esto baja sensiblemente la calidad de lo que haces, pero a cambio agiliza muchísimo la toma de información o la especializa en el caso exacto que deseas contemplar.

 

Cómo se calcula la coocurrencia

Entendido que todo el trabajo sobre la Coocurrencia lo vas a hacer sobre un Corpus concreto, lo que nos queda es aprender a calcularla. No existe una fórmula cerrada para calcular la coocurrencia, ya que esta depende del enfoque que elijas y de lo que quieras extraer de los datos. Sin embargo, las aproximaciones más comunes incluyen la frecuencia de aparición conjunta de palabras o términos en una ventana de palabras definidas, así como métodos estadísticos como el PMI.

Algunos enfoques SEO implican también el uso de n-gramas, que son combinaciones de N palabras consecutivas en un texto. Los n-gramas te permiten medir no solo la frecuencia de palabras individuales, sino también la de combinaciones de términos, lo que resulta valioso para analizar frases clave y contextos semánticos.

El Análisis de Frecuencias

Al final, por muchas matemáticas que veas en posts de SEO técnico, quedate con una cosa. La mayoría de estos análisis se basan en algo tan simple como el análisis de frecuencias. Que viene a ser un «cuenta cuantas repeticiones hay por texto». Simpre que veas cosas como el «TF» (Term Frecuency) o Probabilidades de aparición, se trata tan solo de hacer este tipo de cálculos, solo que a gran escala.
 

El PMI

Un método común para calcular la coocurrencia es el Pointwise Mutual Information (PMI), que mide la probabilidad de que dos palabras aparezcan juntas frente a la probabilidad de que aparezcan por separado.

La fórmula básica para el cálculo de PMI es:

PMI(x,y) = log2 ( P(x,y) / (P(x) * P(y)) )

Donde P(x,y) es la probabilidad conjunta de las palabras x e y, y P(x) y P(y) son las probabilidades individuales de cada palabra. Es decir que el PMI te calcula la relación entre textos que contienen las dos palabras vs los textos que contienen alguna de las dos palabras sin la otra.

Un valor alto de PMI indica una fuerte relación entre los términos mientras que uno bajo nos indica lo poco idóneo que resulta usarlos en un mismo texto.

El TF-IDF

Otra técnica útil es el TF-IDF (Term Frequency-Inverse Document Frequency), que mide la importancia de una palabra en un documento en relación con su frecuencia en un corpus. La fórmula del TF-IDF es:

TF-IDF = TF(t,d) * log ( N / DF(t) )

Donde TF(t,d) es la frecuencia de un término t en un documento d, N es el número total de documentos y DF(t) es la cantidad de documentos que contienen el término t. Esta técnica ayuda en SEO a identificar las palabras más relevantes de un documento por si solas (no mide relaciones), pero puede simplificar los análissi de coocurrencia al señalar solo las palabras más relevantes como punto de partida del análisis.

Cómo afecta al SEO la coocurrencia

La coocurrencia afecta al SEO de varias maneras:

  • Conceptualmente: Nos ayuda a entender cómo Google analiza las relaciones semánticas entre términos en los contenidos web.
  • Prácticamente: Nos permite generar contenido más relevante y enfocado, basándonos en cómo creemos que Google interpreta las relaciones entre palabras clave.

Análisis donde Google aplica la coocurrencia (y que debes conocer)

Aunque no sabemos con certeza cómo Google utiliza la coocurrencia en su algoritmo, si existen indicios de su aplicación en varias áreas:

  • Entendimiento semántico del contenido: Google utiliza la coocurrencia para entender sinónimos, relaciones semánticas y cómo las palabras diferentes pueden potenciar un significado similar. Gracias a su gran corpus es capaz de saber que cuando hablas de buscadores, posicionamiento y googlebot hablas de SEO, incluso si no lo mencionas.
  • Análisis del grafo de enlaces: La coocurrencia entre sitios web y los términos de enlace ayuda a Google a identificar relaciones entre sitios. Además, se puede detectar la existencia de «vecindarios» de sitios web con alta coocurrencia en sus enlaces. Esto puede ser útil para identificar enlaces tóxicos que provienen de sitios ya penalizados por Google, lo que nos permite evitar estos enlaces en las estrategias de linkbuilding.
  • Interpretación de búsquedas: Tecnologías como BERT se basan en parte en el análissi de la coocurrencia para interpretar mejor las consultas de los usuarios y devolver resultados más relevantes. Es cierto que en este caso no se trata solo de coocurrir, sino que el orden de la redacción juega un papel muy importante, pero la base de comprensión de las palabras está ahí.
  • Alimentación de IAs generativas: Las IA generativas, como Google Gemini o ChatGPT parte también de estos análsisis y dependen de la coocurrencia para generar contenido coherente y relevante (aunque otra vez a otro nivel bien distinto).
 

Al final podemos resumir todo esto en lo mismo: Google entiende conceptos en base a la coocurrencia detectada al analizar miles y millones de texto. Sin ella cosas como Word2Vec no tendrían demasiado sentido.

Aplicando la coocurrencia nosotros mismos

Conceptualmente la coocurrencia es ya un concepto lo suficientemente poderoso como para querer aprender de ella y entenderla. Pero los SEOs siempre queremos más, una vez comprendido algo queremos extrimirlo, sacarle todo su jugo y meterlo en nuestras estrategias.

Pero como decíamos, uno de los mayores retos al aplicar la coocurrencia es la falta de acceso a un corpus lo suficientemente grande y la capacidad de procesamiento necesaria para trabajarlo en el día a día. La calidad del análisis siempre depende del tamaño del corpus y la precisión con la que se puedan calcular las relaciones entre palabras. En muchos casos, los intentos que hagamos de cálculos de de coocurrencia a pequeña escala pueden ser inexactos o incluso inútiles. Y es que no puedes luchar con un remo contra la tormenta.

La aproximación clásica y básica no sirve para trabajar con los corpus a los que nosotros vamos a poder tener acceso…

¿Cómo lo solucionamos?

Existen varias técnicas que nos pueden ayudar a superar estas limitaciones y a poder hacer nuestro grabajo aun con corpus muy limitados. Vamos a repasarlas.

Añadir «stop words»

A falta de un corpus que nos ayude a detectar las palabras más comunes del lenguaje, introducimos nosotros esas palabras, no ya minimizándolas como en el IDF, sino eliminándolas del análisis completamente.

Por ejemplo en el PMI veíamos la necesidad no solo de ver cuanto se relacionaban dos términos, sino además de detectar cuantas veces aparecía un término en solitario. ¿Por qué? pues para evitar cosas como que se nos diga que siempre la mayor coocurrencia es como palabras como «el», «la», «de», etc. De otra forma, al analizar cual es la palabra con mayor coocurrencia con «SEO» nos encontraríamos con que esta palabra siempre es «El» porque la gente suele escribir «el SEO».

Como no tenemos capacidad para hacer análisis tan complejos el truco que haremos es eliminar manualmente todas estas palabras de nuestros análisis:

  • Artículos, partículas frecuentes, preposiciones, números, etc. Creamos una lista de palabras con todos ellos y los eliminamos de nuestros textos ANTES de analizarlos.


El resultado será :

  • Potenciar los términos realmente importantes.
  • Y optimizamos el procesamiento y análisis al eliminar muchas palabras de este.
 
 

Aproximación a lexemas

Trabajar con palabras únicas es provocar una granularidad enorme en el análisis. Plurales, tiempos verbales, etc. Son palabras dsititnas que en realidad se refieren a la misma semántica. Mejor que trabajar con palabras es trabajar con sus lexemas. Sin embargo no podemos crear entidades semánticas completas salvo que nos metamos en código y carguemos complejas librerías en nuestros análisis (que si puedes hacerlo es lo mejor, pero no todo el mundo puede).

Si no puedes trabajar con lexemas hay una aproximación menor que te te ayudará mucho y es muy sencilla: Elimina plurales, mayúsculas acentos y símbolos de puntuación de tus textos. Eso simplificará aún más el análisis y fomentará que haya más repeticiones con menos textos (corpus) analizados.

  • Puedes optar por eliminar la vocal o vocal + «s» final de los textos.
  • O optar por algo menos drástico como eliminar los finales de palabra de «es», «s» y «e». 

Por ejemplo, «camión» y «camiones» se convierten en «camion» tras el procesamiento generando la misma palabra o pseudolexema.

Aplicar ventanas de palabras al análisis de coocurrencia

Una forma de hacer más directo lo que aprendemos de la coocurrencia es utilizando ventanas de palabras. ¿Cómo funciona esto? Pues teniendo en cuenta no solo que dos palabras aparezcan en el mismo texto, sino que la separación entre estas en el texto no sea mayor de la ventana que definamos.

Por ejemplo en la frase
«La casa de la pradera es blanca, rústica y muy bonita»,
si aplicamos una ventana de 5 palabras, «casa» está relacionada con «pradera» y «blanca» pero a pesar de aparecer en el mismo texto no lo estaría con «rústica» y «bonita» al estar fuera de la ventana analizada.

Esta claro que aplicar ventanas de 5 palabras no tiene sentido, pero aplicarlas de 100 o 300 palabras simplificará tus procesos al tiempo que garantiza que el texto no haya ido dando saltos de un tema a otro y que midas relaciones entre palabras que en realidad no tenían relación.

Uso de corpus dirigidos

Por último, y quizás lo más importante, ya que vamos a usar corpus pequeños de solo unas decenas o centenas de documentos, centremos muy bien la elección: Escojamos los textos que realmente nos van a ayudar a sacar las coocurrencias que deseamos. ¿Cómo? Pues escogiendo contenidos que representan ya lo que buscamos entender o imitar.

Algunos ejemplos

  • Si analizamos la coocurrencia para posicionar una keyword: usa el contenido de las URLS que actualmente están en el TOP 10 o TOP 20 de esa keyword.
  • Crear guías de redacción para un negocio: utiliza tu propio contenido como corpus y así escribirás de la misma forma que ya venías haciéndolo. Carga todo tu blog o una selección de descripciones de producto como corpus y analízate a ti mismo.
  • Enfoque académico, quieres conseguir contenido académico o buscar relaciones en fuentes de alta caldiad: usa fuentes como Wikipedia, papers o sitios universitarios. Selecciona solo aquellos de gran valor que sean tu fuente de información.
  • Asociación de términos para links: analiza webs sanas con links naturales y extrae de ellas su coocurrencia para poder aplicarla a tu realidad y ver lo lejos que estás de ella.

En definitiva, que el corpus no sea una excusa. Podemos trabajar con corpus y sistema de procesado menores siguiendo estos trucos para obtener un buen resultado. No será perfecto, pero será más que suficnete para guiar nuestras estrategias.

 

¿Cómo y donde lo aplico? Usos de la coocurrencia que puedes hacer al hacer SEO

 

La primera: entenderlo todo mejor

Cuando no entendemos cómo funciona Google, tendemos a unificarlo, a creer que es capaz de razonar o incluso pensar, y eso no es cierto. Le damos poderes mágicos que no se merece. Son mediciones muy eficientes—y por lo tanto simples de calcular—las que consiguen que Google decida qué resultados debe ofrecer en solo milisegundos. Así que las matemáticas, al menos a día de hoy, siguen contando, y mucho.

Mejora tus guías y briefings de redacción SEO

Al detectar términos con alta coocurrencia con los que queremos posicionar, descubriremos qué palabras se alinean semánticamente con aquellas a las que queremos darles más presencia en nuestros contenidos. Así, mejoraremos la relevancia de nuestro contenido tan solo añadiendo palabras que no son directamente nuestra keyword. Eso por otro lado hará a los redactores más fácil su labor al tener más riqueza de términos y temas de los que hablar.

  • Incluye palabras y frases relacionadas con tu keyword principal (las palabras con alta coocurrencia).
  • Aumenta así la densidad semántica del término que quieres posicionar.
  • Y mejorará el posicionamiento en los motores de búsqueda.

Mejora tus prompts de redacción SEO con IA Generativa

Lo mismo que explicabamos para los briefings es aplicable a la autoredacción con IA. No vamos a entrar en este post en los riesgos del contenido basura. A estas alturas deberías saber que crear contenido por crearlo, por mucho que te apoyes en IA, no tiene sentido.

 

Pero eso no quita que no haya muchos escenarios donde puedas dar valor real con contenido basado en IA. En esos escenarios, el análisis de la coocurrencia puede ayudarte a generar textos más ricos y aun así optimizados.

 

Búsqueda de links interesantes

Con alta coocurrencia con los términos que deseamos y no solo aproximación directa a la keyword.

  • Identifica oportunidades de link building más efectivas detectando sites con alta coocurrencia con tu competencia o sector.
  • Analiza sitios bien posicionados para tus términos objetivo.
  • Estudia su perfil de enlaces y estrategias.

Mejora de la optimización semántica

Al aplicar diccionarios de términos altamente afines sobre el contenido que ya existe en tu site, optimizamos la semántica de nuestro sitio haciéndola aún mejor de lo que ya es.

  • Ayudarás a Google a entender mejor de qué trata tu contenido.
  • Aumentarás la relevancia y autoridad temática.
  • Ayudarás a levantar contenidos que a día de hoy no estaban funcionando del todo bien.

Detección de contenido basura o desorientado

Encontrando baja coocurrencia con los términos que deberían ser más afines, podemos identificar contenido que no deja clara su apuesta semántica. Es decir, si sabemos que un contenido debería posicionar para una keyword, analizamos qué terminos tienen altisima coocurrencia con esa keyword y descubrimos que nuestro texto no los usa, podremos detectar automáticamente que esos textos necesitan una mejora imporante. Una vez con el contenido detectado:

  • Elimina o mejora contenido que veas totalmente desorientado.
  • Mejora y optimiza el que tiene oportunidades de aportar valor y posicionar.

Creación de clusters de contenido

A partir de detectar n-gramas de varias palabras, podemos crear contenidos para cada término altamente relacionado con el nuestro, generando un núcleo de varias URLs enlazadas entre sí. 

Es decir, la coocurrencia nos indicará expresiones y temáticas que están muy relacionadas con nuestro contenido. Mirándolas podremos ver que algunas de estas expresiones son búsquedas que podrían disponer de su propio contenido. Con estas búsquedas generaremos URLs nuevas y las posicionaremos. Luego enlazaremos todas estas URLs para crear clusters semánticos que se ayudan a posicionarse unos a otros.

Estrategias de tiers y sites satélite

Aunque estas prácticas pueden considerarse de riesgo (vamos, que son black hat) y no siempre son recomendables, no quería evitar mencionarlas.

La coocurrencia nos puede llevar a realizar el mismo ejercicio que comentabamos de clusters semánticos: Posicionando todo un conjutno de términos afines, pero es que además esto podrémos hacerlo apoyandonos en otros sites. La ventaja de esto es que estos sites al incluir enlaces hacia el nuestro, podrían aportar autoridad extra a nuestros posts y productos para subir algunos puntos en los rankings.

DIcho esto, hay que hacer el típico disclaimer: IKAUE no recomienda el uso de black hat en clientes. Al trabajar con un cliente adquieres una responsabilidad importante y no puedes poner en juego su posicionamiento solo para rascar algunas posiciones fácimente.

 

 

Todo esto esta muy bien pero me queda grande. ¿Cómo empiezo? ¿Cómo lo hago?

Las claves sobre el concepto de coocurrencia y su utilidad ya las hemos repasado en este post. Pero luego tocará ponerlas en prácitca. Para ello, lo que te falta es una herramienta que te haga los cálculos de coocurrencia sobre los contenidos que tu le des.

Lo mejor es que te la programes tú, pero si no sabes nosotros te ayudamos.

En Python, Node.js, Colab, lo que quieras. Si tienes la capacidad de programarte tus propios scripts para calcular la coocurrencia de los textos, no puedo más que animarte a hacerlo. No solo porque crearás una herramienta útil y adaptada a tus necesidades, sino porque en el proceso de programación aprenderás muchos detalles sobre análisis semántico.

Pero a sabiendas de que no todo el mundo puede hacer este tipo de análisis en IKAUEe hemos querido dejarte parte del trabajo ya hecho. Te hemos hecho un Google Sheets que te permite hacer el análiss de coocurrencia de forma manual.

Cómo funciona nuestro Google Sheets de análisis de la coocurrencia

  • Primero debes acceder; está en el área de recursos de Ikaue en la URL: https://ikaue.com/recursos/analisis-coocurrencia.

  • Crea una copia del Sheets para hacerla tuya y poder editarla.

  • Ahora cambia los valores de configuración para empezar tus análisis:

    • La expresión buscada: marcará la palabra que estás buscando, de la que quieres saber la coocurrencia.

    • La ventana: nos dice el número de palabras de separación máxima para que dos palabras coocurran.

    • Las URLs que formarán tu corpus: indica las URLs y el Sheets solo scrapeará el contenido de ellas, buscará el main content y lo analizará.

¿Qué va a hacer nuestro Google Sheet?

  • Recogerá las URLs mediante IMPORTXML.

  • Creará pseudolexemas, eliminando stop words y normalizando las palabras.

  • Recogerá aquellos pseudolexemas que queden cerca de la expresión que buscas (según la ventana).

  • Calculará por n-gramas de 1, 2 y 3 palabras las frecuencias de términos del corpus.

  • Te proporcionará listas que usarás como listados de alta coocurrencia con sus puntuaciones de repeticiones en el corpus.

Estas listas son las que utilizarás para optimizar tu contenido y estrategias de SEO. Deberás filtrar el resultado un poco a mano, pero la lista ahí la tienes.

No es el análissi más profundo de coocurrencia que podrías hacer, pero ya te permitirá muchas de las aplicaicones que se comentaban más arriba en este post.

Conclusión

La coocurrencia es muy importante para el SEO. Google la usa y tú, a pequeña escala, puedes implementarla en tu día a día, haciendo más profesionales muchas de tus acciones SEO cotidianas. No subestimes la importancia de entender y aplicar este concepto en tus estrategias.

Ten en cuenta que, aunque no dispongas de los recursos de Google, hay métodos y herramientas que te permiten aprovechar la coocurrencia de manera efectiva. Nuestro consejo es que experimentes con las técnicas mencionadas y adaptes las que mejor se ajusten a tus necesidades.

Iñaki Huerta
CEO de IKAUE

Director de IKAUE. Analista Digital y SEO hace más de 15 años. Internet Lover, Creador de Hilillos y DataHacker.

Iñaki Huerta Profile Picture

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

IKAUE MARKETING ONLINE, S.L. es la Responsable del Tratamiento de tus datos, con la finalidad de moderar y publicar tu comentario con tu nombre (en ningún caso se publicará tu correo electrónico). Tienes derecho de acceso, rectificación, supresión, limitación, oposición al tratamiento y portabilidad. Puedes ejercitar tus derechos en [email protected]. Más información en la Política de privacidad.

También te puede interesar

¡Suscríbete!

RECIBE NUESTRA NEWSLETTER

Registrar nueva cuenta

IKAUE MARKETING ONLINE, S.L. es la Responsable del Tratamiento de tus datos, con la finalidad de gestionar tu registro y remitirte nuestra Newsletter con las últimas novedades y/o promociones. Tienes derecho de acceso, rectificación, supresión, limitación, oposición al tratamiento y portabilidad. Puedes ejercitar tus derechos [email protected]. Más información en la Política de privacidad.