La inteligencia artificial (IA) se ha convertido en un aliado imprescindible para todos nosotros. Gracias a ella podemos optimizar procesos y multiplicar la velocidad de trabajo que hacemos. En el ámbito del análisis de datos, herramientas como Anthropic Claude, OpenAI ChatGPT y Google Gemini prometen transformarse en un miembro más de la organización, facilitando la automatización y optimización de tareas complejas de análisis. Desde los arreglos de formatos e incoherencias en los datos, la visualización de gráficas y dashboards o la obtención de insights.
Estas IA generativas o LLM no solo agilizan el procesamiento de la información, sino que también actúan como facilitadores de metodologías y procesos estandarizados y buenas prácticas. Como en tantos otros escenarios la IA entra para facilitar y agilizar las cosas a los profesionales. Esto, que ya hemos asumido en tareas como la redacción y la programación, también puede suceder con la analítica de datos.
En este artículo, exploramos en profundidad cómo las tres IA orientadas a texto principales del mercado: ChatGPT, Claude y Gemini, pueden trabajar en entornos empresariales reales, especialmente en el análisis enfocado al marketing digital. Hemos querido comparar las tres y darte insights valiosos sobre cual es mejor en cada tipo tarea, para que luego tu decidas que uso vas a hacer de las IAs.
ChatGPT, en cambio, soporta la subida de archivos de 50MB sin problema. Incluso puede trocear internamente los datos en secciones más pequeñas para poder trabajarlos. Le puedes cargar un archivo bruto, decirle que atienda solo a 2 o 3 columnas y todo funciona.
Gemini sería el más poderoso en este sentido, aunque con limitaciones. soporta la subida de archivos de 100MB. También hace el ejercicio de seleccionar dentro de los archivos para poder trabajar en su ventana de contexto y de hecho lo hace mejor que ChatGPT, eligiendo despúes de leer (ChatGPT tiende a olvidar el final de los archivos si son grandes). A cambio, cuadno lo hace nos muestra un molesto mensaje que nos dice que estamos forzando demasiado la máquina. Un mensaje que sale demasiado pronto, con archivos de pocos MB, pero que no parece afectar al resultado demasiado.
Puntuaciones:
Claude puede transformar los datos, pero como mucho puede mostrártelos en una conversación para que tú hagas corta y pega manual y te crees el archivo.
Gemini por su parte se queda entre ambas. Es capaz de transformar los datos como desees ya sea con la IA generativa o con código (como las otras) y tal y como le pasa a Claude no puede ofrecerte archivos de descarga. A día de hoy, a pesar de su integración con Google Workspace tampoco nos permite crear archivos en Google Drive, pero si tiene vías par conseguirlo. La que más me gusta es la de pedirle datos en formato de tabla, cuando haces eso te ofrece un link para guardarlos en Google Sheets, que es justo lo que necesitamos.
Puntuaciones:
En Claude los datos también se limpian, pero no se limpian tan bien como en ChatGPT o Gemini; puede llevar 2 o 3 iteraciones conseguir empezar a trabajar con datos incorrectos. Luego puede llegar a olvidar estas correcciones y fallar en los datos.
Puntuaciones:
Claude llega a la misma propuesta, poniérndole otro nombre:
Mientras que Gemini pasa a la parte prácitca después de su propuesta:
Claude y Gemini obtienen mejores resultados al clusterizar y detectar patrones en los datos. ChatGPT que es capaz de decirte que colecciones de URLs donde todas empiezan por una carpeta u otra (2 en total) no hay forma de encontrar un patrón en ellas. Sin embargo ChatGPT si puede hacer ese ejercicio muy bien si le reescribes los ejemplos (parece que el problema lo tiene al ver los datos en conjuntos grandes)
ChatGPT tiene un sistema de sugerencias que puede ayudarte en ocasiones con burbujas que te sugieren tu próximo mensaje. Eso está bien, pero en la práctica son opciones bastante obvias que usarás poco. Claude, cuando te entrega algo que no funciona también te añade un botón para arreglarlo automáticamente, pero igual que antes, este botón es lo mismo que decirle «Arreglalo», lo cual no es mucho aporte.
Puntuaciones:
Gemini, aunque hace realmente bien lo que hace, no llega al nivel de Claude. La IA de Google resuelve las visualizaciones de datos con un módulo a medida para gráficos que se parece un poco a la herramientas de creación de gráficos de Google Sheets aunque mucho más limitada. Como puntos fuertes tenemos: Poder editar y personalizar un poco el gráfico, poder verlo como tabla y copiar sus datos a Google Sheets, descargarlo en varios formatos. A mi me resulta muy práctico. Como contras destacaría que solo puedes sacar una visualización por módulo (nada de dashboards como en Claude) aunque si puede en una sola respuesta ofrecerte varios gráficos seguidos mostrándote el resultado para varios segmentos.
En contraposición, ChatGPT tan solo usa Matplotlib, dándote gráficos planos sin capacidad de interacción y, desde luego, por defecto no formula dashboards de verdad.

Cómo funcionan las IAs en el análisis de datos
Para aquellos que nunca habéis probado a utilizar estas IAs para analizar (porque entendemos que usarlas para preguntar o redactar si lo habréis hecho) explicaros como funciona.
- Partimos de usar estos chats basados en IA (ChatGpt, Claude, Gemini) como siempre lo hacemos: Escribiendo y demandando lo que buscamos. El cómo lo escribimos, damos contexto y orientamos a la maquina es todo un arte y daría para otro post entero. Pero aún sin mucha práctica solo por pedir ya obtendremos resultados.
- Pedimos cosas a la IA, como siempre, pero en este caso lo haremos con una orientación directa al análisis, la obtención de resultados y conclusiones a partir de datos de los que dispongamos. Para ello tendremos que conseguir esos datos en nuestro ordenador (normalmente en formato CSV) y se los subiremos a la IA para que pueda trabajarlos. Esto también puede hacerse subiendo imágenes, pero suele ser mucho menos efectivo pues le obligamos a interpretarlas.
- Este análisis, en ChatGPT y en Gemini es automático, la mayoría de sus modelos pueden realizarlo sin problemas (y en los modelos que no puede, simplemente no puede hacerse). En Claude en cambio, esto tenemos que haberlo activado. Tendremos que ir a las opciones de configuración de nuestro usaurio y activar la funcionalidad de «Analysics Tool» (dentro de features).
- Este sistema funciona de forma muy parecida en todas las IA:
1. El sistema nos dirá que está «Analizando» y por detrás escribirá el código de programación con el que trabajará los datos para clasificarlos y optimizarlos. Tu puedes ver ese código haciendo click, pero por defecto viene escondido porque se asume que no te interesa.
2. Luego la IA, por si sola, ejecutará ese código y se quedará con ese resultado y entonces podrá seguir trabajando.
Si lo deseas, y entiendes algo de programación, puedes abrir el código que han generado para ver los pasos que está dando para analizar el contenido.
- Tras este primer análisis la IA vuelve a su modo generativo y ya podrá darnos insights sobre lo que ha extraído, pero la cosa no acaba ahí.
- Otro detalle(opcional) es la capacidad de mostrarnos visualizaciones de datos o devolvernos los datos ya trabajados. En esto ya si que cada IA toma caminos distintos para hacerlo y son un poco distintas, pero el objetivo es el mismo: Comunicarnos los resultados con texto, visualizaciones o documentos.
- De esta forma, bien usado, el sistema puede desarrollar en pocos minutos lo que normalmente nos supondría horas o jornadas completas de trabajo.
Esta funcionalidad, que tan bien suena cuando la explicas, en la práctica aunque muy útil, dista de ser perfecta. Hay análisis que no se realizan bien, hay visualizaciones que son… digamos… difíciles de visualizar. Pero eso no quita que sea una herramienta que debemos controlar e incorporar a nuestro trabajo.
Para ello he pasado unos días enfrentando a distintos sistemas para sacar conclusiones: ¿Con cual me quedo? Pues de eso va este post…
Marco del análisis comparativo realizado
Para entender las capacidades de estas herramientas, hemos realizado el mismo ejercicio de análisis con tres IA, encontrando problemas y virtudes distintas en cada sistema. Este análisis no es técnico ni se basa en benchmarks oficiales o pruebas de estrés, sino que es una experiencia práctica intentando realizar análisis reales con las IA en el contexto de nuestra agencia, IKAUE.Los modelos que hemos evaluado
- OpenAI ChatGPT GPT4o: La versión omnidireccional y multimodal, capaz de cargar archivos y utilizar módulos de análisis. Es la versión por defecto al abrir un chat. Entre las más avanzadas, puede cargar archivos y acceder a módulos de análisis, además de ser multimodal.
- Claude Sonet 3.5 New: La nueva versión de Anthropic que incluye el módulo Analytics Tool, permitiéndole analizar creando y ejecutando código. Incluye la posibilidad de usar herramientas analíticas, lo que le da también la capacidad de analizar creando y ejecutando código.
- Gemini Advanced para Workspace: La versión de pago de Google, que por detrás usa los modelos Gemini Flash y Gemini Pro según la petición que le hagas. Nos aporta los citados módulos de análisis mediante código, algo de razonamiento y las extensiones con la suite de Google Workspace (conectividad con documentos, hojas de cálculo, agendas , etc.)
Metodología y contexto del análisis
Los análisis se llevaron a cabo entre octubre y diciembre de 2024, y desde esa fecha es probable que las IA evolucionen. En ventanas simultáneas, enfrentamos los mismos análisis exactos a las IA, cargando datos propios de IKAUE (nuestra agencia) y datos anonimizados de clientes. Las pruebas incluyeron:- Cargas de varias colecciones de datos de Google Analytics 4 (GA4), exportadas desde la interfaz, sobre las que pedimos análisis de la situación y proporcionamos contexto sobre las estrategias seguidas. Ejemplos de campañas, canales, comportamiento y conversión.
- Cargas de stocks de productos descargados y organizados previamente, incluyendo datos de ventas. Solicitamos análisis del stock, categorías y tipologías de productos.
- Cargas de datos de Google Search Console para validar keywords y URLs, además de su evolución.
- Datos copiados desde el navegador de los resultados de distintas herramientas SEO: Sistrix, Ahrefs, etc.
- Cargas de esos mismos datos transformados en otros formatos distintos al CSV: XML, JSON, tablas HTML, y copias directas desde Sheets y Excel.
Sobre mí (por si quieres saberlo)
Dado que el análisis tiene una alta carga subjetiva, para dar más contexto para quien no me conozca (si ya sabes quien soy sáltatelo sin problema), algunos detalles: Soy Iñaki Huerta, analista digital y SEO, introducido en el mundo web hace más de 20 años y llevando más de 17 en ambas materias. Llevo 10 años liderando IKAUE y trabajando para multitud de grandes clientes. Vengo de la rama de comunicación, pero habiendo programado desde que recuerdo. A día de hoy, programo bajo PHP, JavaScript (& Node), R y algo de Python (que es la que menos domino). Tengo muy alto nivel en SQL y en tratamiento de datos, así como en su visualización en varias herramientas. He trabajado con Machine Learning e IA desde el principio y estoy acostumbrado a trabajar con enormes cantidades de datos. En definitiva, un profesional orientado a negocio pero con habilidades técnicas.Categorías de este análisis
Las categorías en las que dividimos este análisis son:- Inserción y descarga de datos: Aquí hablamos de las capacidades del sistema para trabajar sin importar el resultado. Formatos de archivos, pesos, capacidad para reiterar peticiones, etc. La parte técnica.
- Manipulación y corrección de los datos: Cómo los entiende en primera instancia, los arregla y los prepara para el análisis. Ese trabajo previo que todo analista tiene que hacer cuando la herramienta o el ingeniero de datos no le dan todo el trabajo ya ordenado.
- Capacidades de análisis base: Cómo entra la IA en el análisis, entiende los datos y te ayuda a enfocar el estudio.
- Visualización de datos: Capacidad de darte una salida gráfica que puedas entender y usar en tus informes.
- Obtención y explicación de insights: Cómo es de capaz de darte información válida sobre los datos que te lleve a conclusiones prácticas .
1. Inserción y descarga de datos
En esta sección, analizamos las capacidades técnicas de ambos sistemas para trabajar con diferentes formatos de archivos, pesos y la facilidad para reiterar peticiones.1.1 Formatos soportados
CSV: Es el formato esperado por todas las IA y con el que trabajan mejor. Ninguna presenta problemas al manejar este tipo de archivos. XML: Claude puede trabajar con XML, aunque con algunos errores y puede requerir correcciones manuales. ChatGPT y Gemini los leen a la primera sin problemas. JSON: Ninguno ha tenido problemas al manejar archivos en formato JSON. Corta y pega de datos: ChatGPT entiende tablas copiadas y pegadas sin darles formato alguno, tratándolas directamente como datos tabulados. Copiadas desde cualquier fuente, las interpreta sin problemas. Claude y Gemini, en cambio, necesita crear un código de parseo a medida, a veces falla y siempre hacen que vaya más lento. Conexión con archivos: Ni ChatGPT ni Claude pueden conectarse directamente a archivos. Gemini en cambio si puede consumir datos de Google Sheets o de tablas en documentos (Slides o Docs o Keep) haciendo más directo el trabajo si ya trabajas con esas herramientas. Puntuaciones:- ChatGPT: 5
- Claude: 3
- Gemini: 5
1.2 Entrada de datos y límites de tamaño
Aunque Claude dice soportar archivos de 30MB, en la práctica, al usar Analytics Tool, a partir de los 400 o 500KB empieza a no permitir la subida debido al límite de información en la conversación. Ignoro si esto es un problema temporal, pero sucede en todos los casos incluso con cuenta de pago. Para análisis serios, medio mega de datos es un grandísimo limitante. Además, mientras que ChatGPT separa archivos y conversación al calcular sus limites, Claude mete el contenido de los archivos en sus límites, por lo que solo por cargar un archivo ya estás bajando considerablemente el límite de la conversación.- ChatGPT: 4
- Claude: 2
- Gemini: 5
1.3 Capacidad de trabajo y límites de conversación
Claude puede manejar ventanas de 200K tokens, lo cual en teoría da para una larguísima conversación con respuestas y revisiones de todo tipo. No debería tener problemas de ningún tipo en la mayoría de situaciones. ChatGPT llega a 128K de contexto, bastante menos. Sin embargo, sigue siendo más que suficiente para analizar. Gemini por su parte llega al millón de tokens, pulverizando las marcas de los otros 2. Pero los problemas, al analizar datos, no aparecen por el límite de contexto total, sino por mensaje y conversación. Algo que no está escrito oficialmente en las documentaciones y que frena sobretodo a los dos primeros sistemas. Así que lo hemos testeado a mano:- ChatGPT GPT4o admite en un solo mensaje más de 100K caracteres y unas 20K palabras. En O1 esto sube a 200K caracteres y algo menos de 40K palabras. No existe un límite de conversación, pero las cosas empiezan a fallar cuando se pasan esos mismos límites, sin que fallen siempre ni que el sistema se queje del tamaño: solo da errores al entregarte el mensaje. (Esto se da más en O1 que en GPT4o pero es un defecto del sistema).La siguiente imagen muestra lo frustrante que puede ser pasarle 12 veces los datos a ChatGPT y que te devuelva un error.
- Claude tiene un límite de mensaje en la interfaz mucho menor que es difícil de definir. El propio Claude puede indicarte que le quedan cientos de miles de tokens para seguir trabajando y, sin embargo, darte errores por haber pasado el límite de la conversación. Esto sucede demasiado, tanto que resulta casi imposible profundizar en un análisis serio sin volver a iniciar una nueva conversación para eliminar estos límites. Si, es cierto que le puedes pedir que borre el contexto, pero para eso es mejor volver a iniciar la conversación.Toda esta parte hace limitante trabajar con Claude con archivos iniciales de más de 200KB de datos, pero el sistema se comporta mucho mejor con pequeños archivos de 50KB. Pero claro, para esos archivos no es para lo que acudimos a estos sistemas.En definitiva, en Claude, es preferible cargarle solo las 2 o 3 columnas de datos que necesitas y reducir al máximo posible tus archivos. Incluso es probable que te veas forzado a bajar la granuralidad de tus datos (por ejemplo yo he tenido que pasar datos en vez de diarios semanales para que pudiese trabajar).
- Gemini en cambio, salvo el aviso mencionado antes no ofrece resistencia de ningún tipo. Hemos probado a hacerle entradas de texto titánicas y nunca se ha quejado. En este sentido es la más capaz.
- ChatGPT: 4
- Claude: 2
- Gemini: 5
1.4 La salida y la transformación de datos
ChatGPT puede transformarte los datos y ofrecerte un enlace de descarga en cualquier formato estándar. Para ello, solo tienes que pedirle que te de un link para descargar el archivo que buscas.- ChatGPT: 5
- Claude: 3
- Gemini: 4
Puntuación total de Inserción y descarga de datos
ChatGPT: 18/20 Claude: 10/20 Gemini: 19/202. Manipulación y corrección de los datos
Analizamos cómo los sistemas entienden los datos en primera instancia, los arreglan y los preparan para el análisis, emulando el trabajo previo que todo analista realiza cuando la herramienta o el ingeniero de datos no le dan todo el trabajo ya ordenado.2.1 Correcciones de formato
Las 3 IAs pueden detectar errores de formato en los archivos, limpiarlos y conseguir trabajar con ellos la mayor parte de las veces. Sin embargo, ChatGPT y Gemini son más hábiles en esta tarea. Se dan cuenta antes de los errores y detectan incoherencias, no solo errores de formato. Corrigen los datos en el primer mensaje y suelen hacerlo bien.- ChatGPT: 5
- Claude: 3
- Gemini: 5
2.2 Coherencia y errores en el análisis
Todos los sistemas crean piezas de código para ayudarse a analizar los datos. El proceso es similar: crean el código (Claude Con Javascript y ChatGPT y Gemini con Python), lo aplican a los datos y obtienen un resultado con el que obtener conclusiones. En este ejercicio, ambos suelen equivocarse y se corrigen a sí mismos. Cada uno peca de cosas distintas:- ChatGPT puede llegar a entrar más en bucles que no resuelve, terminando por no dar por bueno el análisis tras varios intentos.
- Claude suele terminar bien el análisis, pero sus límites de tamaño de mensajes vuelven a hacerle fallar cuando necesita varios intentos, dejando todo el ejercicio realizado como nulo y teniendo que volver a empezar.
- Gemini puede decidir por su cuenta eliminar filas que dan error o dejarte datos vacios por no transformar bien el formato y no darse cuenta. Le corriges y lo arregla, pero sin una revisión manual puede jugarte alguna mala pasada.
- ChatGPT: 4
- Claude: 3
- Gemini: 3
Puntuación total de Manipulación y corrección de los datos
ChatGPT: 9/10 Claude: 6/10 Gemini: 8/103. Capacidades de análisis base
Evaluamos cómo la IA entra en el análisis, entiende los datos y ayuda a enfocar el estudio de datos que le pedimos.3.1 Primera aproximación a los datos enviados
Todos son igual de buenos comprendiendo lo que quieres; se aproximan a los datos dándoles contexto, entienden el tipo de información que contienen y lo aplican al la realidad que se les explica. Son capaces de poner en práctica el know-how y enfocarse en resultados prácticos. Las primeras versiones de análisis con ChatGPT pecaban de no entender algunos datos. O Trabajaban números como textos o no intentaban entender que significaban categorías y variables. Eso ha quedado atrás y el contexto es bastante bueno en ambos casos. Incluso mejor del que aplican muchas personas. A pesar de que pensaba encontrar comportamientos distintos, no he encontrado grandes diferencias entre ambos en este terreno. Puntuaciones:- ChatGPT: 5
- Claude: 5
- Gemini: 5
3.2 Facilidades que nos aportan e ideas propias
Las IAs son capaces de proponer KPIs y de provocar datos nuevos calculados. Claude si que suele crear métricas y KPIs más relacionados con el contexto y caso relatado. ChatGPT va una y otra vez a los tópicos del mercado y se repite un poco (pero sigue haciendo un gran trabajo). Gemini igual no tiene expresiones matemáticas como las de Claude para expresarse pero suele añadirte un plus de realidad. Te indica cómo podrías usar ese dato o directamente pasa a visaulizartelo (sin que se lo pidas) para que te hagas una idea de su utilidad. Ejemplo ChatGPT proponiendo un KPI:- ChatGPT: 4
- Claude: 5
- Gemini: 5
3.3 Análisis guiados paso a paso
Todos los sistemas pueden procesar la información y obedecen las órdenes dadas cuando se es muy explícito en los mensajes que le das. Usan lenguajes distintos para exposición, pero con el mismo éxito. Siempre y cuando cada operación sea clara y las vayas separando mensaje a mensaje, los dos primeros (ChatGPT y Claude) suelen seguir las órdenes con pocos errores. Gemini Advanced en cambio es un poco más olvidadizo y se lleva mejor con las peticiones con más contexto en un solo mensaje. En particular la IA de Google responde muy mal a mensajes cortos del tipo «Hazlo», «Crúzalo ahora con este campo», «Sigue con el paso 2» donde a veces no revisa su conversación y no te responde adecuadamente. Esto es debido (creo) a que el Chat de Gemini decide en cada petición qué modelo aplicar según su complejidad. Si le pides cosas sencillas acude a modelos simples y solo usa todo el potencial de Gemini Pro cuando lo necesita. Se arregla de forma muy sencilla: Pidiendole clas cosas siempre con más referencias y más texto. Es decir, no es grave, pero si incómodo. Cuando si que se atascan, si les guias en las soluciones todos saben seguir a partir de tus «sugenrencias». En esta tarea Gemini vuelve a necesitar de más texto y un lenguaje menos conversacional. Puntuaciones:- ChatGPT: 5
- Claude: 5
- Gemini: 3
3.4 Análisis complejos (donde la IA toma la iniciativa)
Cuando le dejas resolver las cosas por si mismo, Gemini es el que mejor resuelve la lógica del dato, lo procesá paso a paso hasta llevarlo a donde quieres. Incluso en muchos puntos toma la iniciativa y va más allá dándote insights que aún no le habías pedido. ChatGPT también aprueba con nota en este terreno. Resuelve los pasos que necesita y los va colocando uno tras otro hasta darte la versión de los datos que necesitas. Es más matemático y ordena bien las «ideas». Claude no lo hace nada mal, pero sigue peor las mecánicas y hay que ayudarle más a terminar de resolver las cosas. Sin embargo, todos garantizan consistencia en respuestas y dinámicas de colaboración asistida. Para mi los tres tienen casi un 5, pero dado que se trata de hacer notorias sus diferencias y esta claro quien es el mejor y el peor (dentro de hacerlo muy bien) lo dejamos así… Puntuaciones:- ChatGPT: 4
- Claude: 3
- Gemini: 5