Chatbot vs Agente IA: de conversaciones a delegar responsabilidades •

El agente no estaba muerto, estaba de parranda

Hay una frase popular que siempre me ha hecho gracia: “no estaba muerto, estaba de parranda”. Durante los últimos meses me he descubierto repitiéndola varias veces, aunque no precisamente pensando en música.

Pensaba en los agentes de inteligencia artificial.

Y, de alguna manera, también pensaba en mí.

Si echo la vista atrás, me doy cuenta de que llevo varios años siguiendo la evolución de la inteligencia artificial casi sin darme cuenta de que todas las piezas formaban parte de una misma historia.

Primero llegó el Machine Learning. Después el Deep Learning. Más tarde aparecieron los grandes modelos de lenguaje, los sistemas RAG, los primeros agentes construidos con CrewAI y Ollama, la documentación técnica, los experimentos con modelos open source y, finalmente, proyectos como Secretario IA, OpenCTO, OpenCIO y OpenCMO.

Mirándolo ahora parece un camino perfectamente trazado.

No lo fue.

Como ocurre con casi cualquier proceso de aprendizaje, muchas veces tuve la sensación de estar saltando de un tema a otro. Hubo momentos en los que parecía que el mundo entero hablaba únicamente de ChatGPT, Gemini o Claude. Cada pocas semanas aparecía un modelo nuevo, un benchmark mejor o un framework diferente que prometía cambiarlo todo otra vez.

Mientras tanto yo seguía experimentando, escribiendo artículos, construyendo prototipos y tratando de entender qué estaba ocurriendo realmente detrás de todo ese ruido.

Recuerdo perfectamente una de esas primeras sensaciones.

Mucho antes de que ChatGPT se hiciera popular tuve la oportunidad de probar GPT en Playground. En aquella época muchos profesionales del SEO utilizábamos Spintax para generar variaciones de contenidos. Aquellas herramientas eran útiles, pero funcionaban siguiendo reglas. Sustituían palabras, reorganizaban frases y producían cientos de versiones diferentes de un mismo texto sin comprender realmente lo que estaban escribiendo.

La primera vez que utilicé GPT (antes de octubre de 2022) sentí que aquello no era simplemente una herramienta mejor.

Era una tecnología diferente.

Recuerdo pensar que estaba viendo una pequeña parte del futuro. Ya conocía los transformers, la arquitectura que revolucionó el procesamiento del lenguaje natural, y cómo Google la estaba aplicando tanto en su traductor como en BERT, uno de los modelos que marcaron un antes y un después en tareas como el análisis de sentimiento y la comprensión del lenguaje.

Y, sin embargo, mirando atrás creo que tampoco aquella era la verdadera revolución.

Durante estos últimos años he escrito en este blog sobre chatbots, agentes virtuales, Agent Workflows, Google Cloud Next ‘24, CrewAI, Ollama, RAG, Machine Learning y asistentes inteligentes. En su momento todos esos artículos tenían sentido por separado. Hoy me doy cuenta de que todos estaban intentando responder a la misma pregunta.

Una pregunta que yo mismo todavía no sabía formular.

Durante mucho tiempo pensé que la evolución de la inteligencia artificial consistía en construir modelos cada vez más inteligentes.

Hoy creo que la verdadera evolución ha ocurrido en otro lugar.

Mientras todos discutíamos sobre modelos, prompts, benchmarks y ventanas de contexto, la idea más importante seguía evolucionando silenciosamente.

El agente no estaba muerto.

Estaba de parranda.

Andrew Ng hablaba de sistemas capaces de planificar, utilizar herramientas, reflexionar sobre sus propios resultados y colaborar con otros agentes. Google comenzaba a presentar Customer Agents y Employee Agents. OpenAI hablaba de agentes que realizan tareas en nombre de los usuarios. Microsoft empezaba a utilizar el concepto de digital labor. Cada empresa utilizaba un lenguaje diferente, pero todas parecían dirigirse hacia la misma idea.

La conversación ya no era suficiente.

La siguiente frontera consistía en construir sistemas capaces de asumir responsabilidades.

Y entonces comprendí que la pregunta importante nunca había sido qué modelo utilizar.

Ni siquiera qué framework elegir.

La verdadera pregunta era mucho más sencilla.

¿Qué responsabilidades estamos dispuestos a delegar en sistemas inteligentes?

La era de las automatizaciones

Antes de que habláramos de inteligencia artificial, de modelos de lenguaje o de agentes, las empresas ya llevaban décadas automatizando procesos.

De hecho, probablemente todos utilizamos automatizaciones varias veces al día sin darnos cuenta.

Cuando un cliente rellena un formulario en una página web y recibe automáticamente un correo de confirmación, hay una automatización detrás. Cuando una compra en una tienda online genera una factura, actualiza el stock y envía una notificación al almacén, también. Cuando un CRM crea una tarea para que un comercial llame a un nuevo cliente potencial, estamos hablando exactamente de lo mismo.

La automatización no nació con ChatGPT, Gemini o Claude.

Las automatizaciones llevan muchos años ayudándonos a eliminar tareas repetitivas, reducir errores y mejorar la eficiencia de los procesos.

El principio siempre ha sido muy sencillo:

Si ocurre A, ejecutar B.

O, dicho de otra forma:

Si un usuario envía un formulario, enviar un correo.
Si una factura cambia de estado, avisar al cliente.
Si un sensor supera una temperatura determinada, generar una alarma.

Todo estaba basado en reglas previamente definidas.

Durante años aparecieron herramientas que facilitaron enormemente este tipo de desarrollos. Desde pequeños scripts en Python o Bash hasta programadores de tareas (cron en Linux), pasando por plataformas de automatización como Zapier, Make, N8N o los flujos de trabajo integrados en muchos CRM y aplicaciones empresariales.

Todas ellas compartían una característica fundamental.

No entendían el problema que estaban resolviendo.

Simplemente ejecutaban una secuencia de instrucciones diseñada por una persona.

Podían hacerlo miles de veces sin cometer errores (eran deterministicas), pero eran incapaces de adaptarse cuando aparecía una situación no prevista.

Y eso no era una limitación de las herramientas.

Era precisamente su razón de ser.

Las automatizaciones son excelentes cuando conocemos exactamente el proceso que queremos ejecutar.

El problema aparece cuando dejamos de saber de antemano cuál será el siguiente paso.

¿Qué ocurre si el cliente hace una pregunta que no estaba prevista?

¿Qué ocurre si la información necesaria está repartida entre varios documentos?

¿Y si antes de actuar hay que interpretar el contexto, comparar alternativas o decidir qué herramienta utilizar?

Ahí es donde las automatizaciones tradicionales empiezan a quedarse cortas.

Durante mucho tiempo pensamos que la solución consistía simplemente en añadir más reglas.

Más condiciones.

Más excepciones.

Más diagramas de flujo.

Pero la realidad es que cada nueva regla hacía el sistema un poco más complejo y un poco más difícil de mantener.

Todavía no hablábamos de agentes.

Ni siquiera de chatbots modernos.

Pero la necesidad ya estaba ahí.

Las empresas necesitaban sistemas capaces de hacer algo más que ejecutar instrucciones.

Necesitaban sistemas capaces de interpretar una situación antes de actuar.

Y ese cambio de paradigma estaba mucho más cerca de lo que imaginábamos.

Los chatbots: la conversación como interfaz

Durante décadas, muchos pensaron que el lenguaje era la última gran frontera de la inteligencia artificial.

Las máquinas ya eran capaces de realizar millones de cálculos por segundo. Mucho antes de que aparecieran los ordenadores personales, una simple calculadora superaba ampliamente la capacidad de cálculo de cualquier ser humano. Sin embargo, nadie confundía una calculadora con una inteligencia.

Pero el desafío era el lenguaje.

Comprender una conversación, interpretar dobles sentidos, responder con coherencia o mantener el contexto parecía algo exclusivamente humano. Desde la filosofía hasta la informática, el lenguaje se consideraba una de las características que mejor representaban nuestra inteligencia.

En 1950, Alan Turing propuso un experimento que acabaría convirtiéndose en uno de los más conocidos de la historia de la computación: el Test de Turing. La idea era aparentemente sencilla. Si una persona mantenía una conversación escrita con dos interlocutores, uno humano y otro máquina, y era incapaz de distinguir cuál era cuál, podríamos considerar que la máquina mostraba un comportamiento inteligente.

Durante décadas aquello pareció una meta inalcanzable.

Los primeros chatbots, como ELIZA, eran sorprendentes para su época, pero funcionaban mediante reglas y patrones muy simples. Bastaban unas pocas preguntas para descubrir que detrás de la conversación no había comprensión alguna.

Todo cambió con la llegada de los Large Language Models (LLM) y de la arquitectura Transformer, basada en el mecanismo de atención que revolucionó el procesamiento del lenguaje natural. Si te interesa comprender cómo funciona esta tecnología, dediqué un artículo completo al mecanismo de atención en los modelos Transformer.

Por primera vez las máquinas no solo respondían.

Parecían comprender.

Y esa diferencia fue suficiente para cambiar la percepción que teníamos de la inteligencia artificial.

La primera revolución conversacional

ChatGPT fue el gran catalizador.

Aunque la tecnología llevaba años desarrollándose, la publicación de ChatGPT permitió que millones de personas experimentaran por primera vez una conversación fluida con una inteligencia artificial.

La interfaz era extraordinariamente simple.

Un cuadro de texto.

Una pregunta.

Una respuesta.

Sin embargo, detrás de esa simplicidad se escondía una revolución tecnológica que llevaba gestándose durante años.

De repente ya no era necesario aprender comandos, menús o interfaces complejas.

Podíamos comunicarnos con una máquina utilizando nuestro propio lenguaje.

La conversación se convirtió en la nueva interfaz entre las personas y el software.

Los chatbots para empresas

En el mundo empresarial aquello abrió inmediatamente un abanico enorme de posibilidades.

Una automatización que además era capaz de mantener una conversación natural podía responder preguntas frecuentes, atender clientes, capturar oportunidades comerciales, ayudar a los empleados o asistir en procesos internos sin obligar al usuario a navegar por formularios o aplicaciones complejas.

Muchas empresas comenzaron a descubrir que el verdadero valor no estaba únicamente en automatizar procesos, sino en hacer que esos procesos fueran mucho más accesibles mediante el lenguaje natural.

En otro artículo del blog analicé precisamente cómo esta nueva generación de chatbots podía ayudar a pequeñas empresas y autónomos en tareas como la atención al cliente, la gestión de reservas o la captación de leads: Los Chatbots Pueden Transformar tu Negocio.

¿Por qué seguían siendo automatizaciones?

Y aquí es donde empieza realmente la historia que nos interesa.

Porque, por espectacular que resultara mantener una conversación con una inteligencia artificial, la mayoría de aquellos sistemas seguían funcionando de manera reactiva.

Esperaban una pregunta.

Generaban una respuesta.

Y volvían a esperar.

Podían comprender lenguaje natural gracias a los modernos LLM y al mecanismo de atención de los Transformers, pero seguían sin tener un objetivo propio, sin planificar acciones, sin utilizar herramientas de forma autónoma y sin asumir responsabilidades dentro de un proceso.

La conversación había cambiado radicalmente.

La naturaleza del sistema, todavía no.

Y precisamente esa diferencia es la que empieza a explicar por qué un chatbot, por inteligente que parezca, sigue sin ser necesariamente un agente.

Los LLM cambiaron las reglas

A finales de 2022 ocurrió algo que muy pocos esperaban.

Los modelos de lenguaje llevaban años evolucionando. GPT no nació con ChatGPT. Google llevaba tiempo investigando con Transformers, BERT y otros modelos de lenguaje, y la comunidad científica publicaba continuamente mejoras en arquitecturas y algoritmos.

Sin embargo, durante bastante tiempo los resultados parecían prometedores, pero insuficientes. Los modelos cometían errores evidentes, alucinaban con frecuencia y estaban lejos de mantener una conversación realmente natural.

Y entonces algo cambió.

No fue una mejora incremental.

Fue un cambio de fase.

A medida que aumentaban el tamaño de los modelos, la cantidad de datos utilizados para el entrenamiento y el número de iteraciones, empezaron a aparecer comportamientos que ni siquiera los propios investigadores esperaban encontrar tan pronto.

Hoy sabemos que fenómenos como el Double Descent o el Grokking ayudan a explicar parte de este comportamiento. En lugar de empeorar por un supuesto sobreajuste (overfitting), algunos modelos seguían mejorando cuando parecían haber superado todos los límites que el Machine Learning clásico consideraba razonables.

Si te interesa profundizar en estos fenómenos, escribí un artículo y se cuentan lo que son estos términos en los modernos de inteligencia artificial: Pareidolia en IA: patrones, Double Descent y Grokking.

La sensación para quienes seguíamos el sector fue muy difícil de describir.

No era simplemente que los modelos respondieran mejor.

Era que empezaban a hacer cosas que unas semanas antes parecían imposibles.

GPT, Gemini y Claude

La respuesta de la industria fue inmediata.

OpenAI abrió el camino con ChatGPT.

Google aceleró el desarrollo de Gemini.

Anthropic presentó Claude.

Meta impulsó la comunidad open source con Llama.

Y junto a ellos aparecieron decenas de modelos especializados como Mistral, Qwen, DeepSeek, Phi o Gemma.

Por primera vez no competían únicamente las empresas.

Competían también las arquitecturas, las estrategias de entrenamiento y las filosofías de desarrollo: modelos propietarios frente a modelos abiertos, modelos gigantes frente a modelos eficientes, modelos generalistas frente a modelos especializados.

La carrera por construir el mejor LLM acababa de comenzar.

El salto desde Spintax

Para quienes veníamos del mundo del SEO el contraste era todavía más evidente.

Durante años habíamos utilizado herramientas como Spintax para generar variantes de un mismo contenido.

Aquellas herramientas seguían reglas.

Sustituían palabras.

Reordenaban frases.

Pero no entendían absolutamente nada de lo que estaban escribiendo.

Comparado con aquello, un LLM parecía magia.

Ya no necesitábamos describir cómo transformar un texto.

Bastaba con explicar el objetivo.

En cierto modo dejamos de programar reglas para empezar a dialogar con la máquina.

La conversación mejora radicalmente

Curiosamente, gran parte de la calidad que hoy percibimos en asistentes como ChatGPT o Claude no procede únicamente del preentrenamiento del modelo.

Una vez finalizado ese enorme proceso de aprendizaje sobre billones de palabras, comienza una segunda etapa igual de importante: el ajuste mediante retroalimentación humana (Reinforcement Learning from Human Feedback, RLHF) y otras técnicas posteriores de alineamiento.

Es durante esa fase cuando los modelos aprenden a mantener conversaciones más útiles, seguir instrucciones con mayor precisión y ofrecer respuestas mucho más naturales para las personas.

En otras palabras, no solo aprenden lenguaje.

Aprenden a conversar.

Pero seguían siendo sistemas reactivos

Y, sin embargo, todavía faltaba algo.

Por brillante que fuera una conversación con un LLM, el modelo seguía esperando nuestra siguiente pregunta.

No iniciaba tareas por iniciativa propia.

No planificaba.

No decidía qué herramientas utilizar.

No comprobaba si había alcanzado un objetivo.

No vigilaba información mientras nosotros hacíamos otras cosas.

En definitiva, seguía siendo un sistema reactivo.

Era extraordinariamente inteligente respondiendo.

Pero todavía no trabajaba para nosotros.

Y esa diferencia, que puede parecer sutil, es precisamente la que Andrew Ng empezó a poner sobre la mesa cuando habló de Agentic Workflows.

No bastaba con conversar.

Había llegado el momento de empezar a delegar trabajo.

Andrew Ng y el regreso de los agentes

Cuando hoy hablamos de IA Agentic parece que estemos describiendo una tecnología completamente nueva.

Sin embargo, la idea fundamental ya estaba formulada mucho antes de que OpenAI presentara sus agentes, Microsoft hablara de Digital Labor o Salesforce lanzara Agentforce.

Quien probablemente mejor supo anticipar esta evolución fue Andrew Ng.

A comienzos de 2024 publicó una de las reflexiones que, en mi opinión, mejor ha envejecido de toda esta revolución tecnológica. En ella explicaba que el verdadero salto no consistía únicamente en construir modelos de lenguaje más potentes, sino en hacer que esos modelos fueran capaces de trabajar siguiendo una serie de patrones que hoy conocemos como Agentic Workflows.

En aquel momento escribí un artículo completo sobre esa idea porque me pareció que describía hacia dónde se dirigía realmente la inteligencia artificial.

👉 Agent Workflows: La Revolución Silenciosa de la IA que No Puedes Ignorar

Mirándolo ahora, dos años después, tengo la sensación de que Andrew Ng no estaba describiendo una moda pasajera.

Estaba definiendo la arquitectura conceptual de los agentes modernos.

Agent Workflows

Lo interesante de su propuesta es que no definía un agente por el modelo que utilizaba.

Lo definía por cómo trabajaba.

Andrew Ng resumía ese comportamiento en cuatro patrones fundamentales.

Reflection (Reflexión)

Un agente no acepta su primera respuesta como definitiva.

Es capaz de revisar su propio trabajo, detectar posibles errores y mejorarlo antes de dar por terminada una tarea.

No responde una única vez.

Itera.

Planning (Planificación)

En lugar de intentar resolver un problema complejo de una sola vez, el agente puede dividirlo en objetivos intermedios y construir un plan de ejecución.

Empieza a aparecer algo que una automatización clásica nunca tuvo:

la capacidad de organizar su propio trabajo.

Tool Use (Uso de herramientas)

Quizá este sea uno de los cambios más importantes.

El modelo deja de depender únicamente del conocimiento aprendido durante el entrenamiento.

Puede consultar bases de datos, realizar búsquedas, ejecutar código, llamar a APIs o utilizar cualquier otra herramienta necesaria para completar una tarea.

Ya no responde únicamente con lo que sabe.

Puede obtener información nueva mientras trabaja.

Multi-Agent Collaboration

Finalmente aparece una idea especialmente interesante.

En lugar de intentar que un único modelo haga absolutamente todo, varios agentes especializados colaboran entre sí.

Cada uno aporta sus capacidades y responsabilidades para alcanzar un objetivo común.

Curiosamente, esto se parece mucho más al funcionamiento de una empresa que al de un chatbot.

El agente no había desaparecido

Y aquí fue cuando comprendí algo que no había visto durante los meses anteriores.

Mientras todos hablábamos de GPT-4, Gemini, Claude o de cuál era el mejor modelo del momento, Andrew Ng estaba poniendo el foco en otra cuestión completamente distinta.

No hablaba del modelo.

Hablaba del trabajo.

No hablaba de la conversación.

Hablaba del proceso.

No hablaba de responder mejor.

Hablaba de alcanzar un objetivo.

Por eso creo que la expresión “el agente no estaba muerto, estaba de parranda” resume bastante bien lo que ocurrió durante aquellos años.

Los focos estaban apuntando hacia los modelos.

Pero la verdadera revolución seguía avanzando silenciosamente en otra dirección.

La conversación había sido resuelta.

Ahora el reto consistía en conseguir que la inteligencia artificial planificara, utilizara herramientas, colaborara y asumiera responsabilidades.

Y esa diferencia, aunque pueda parecer pequeña, marca el comienzo de una nueva etapa.

La etapa de la IA Agentic.

Cuando toda la industria empezó a converger

Hasta este momento podría parecer que todo lo anterior no deja de ser una interpretación personal.

Quizá yo estaba viendo una evolución donde realmente no la había.

Sin embargo, ocurrió algo muy interesante.

Empresas que competían entre sí, utilizaban tecnologías diferentes y perseguían estrategias completamente distintas empezaron a describir una visión sorprendentemente parecida del futuro.

No hablaban exactamente del mismo producto.

Ni utilizaban la misma terminología.

Pero todos parecían dirigirse hacia una misma idea.

Google Cloud Next 2024

Uno de los primeros momentos en los que fui consciente de ello fue durante Google Cloud Next 2024.

Google ya no hablaba únicamente de modelos de lenguaje.

Empezó a hablar de Customer Agents, Employee Agents y de herramientas para construir agentes especializados mediante Vertex AI Agent Builder.

Aquello me llamó mucho la atención porque suponía un cambio de discurso.

El protagonista ya no era Gemini.

El protagonista empezaba a ser el agente.

En aquel momento resumí las principales novedades en este artículo:

👉 Google Cloud Next ‘24: Google se suma a la carrera de los Agentes IA

OpenAI Agents

Tiempo después OpenAI empezó a utilizar exactamente el mismo lenguaje.

Ya no presentaba únicamente modelos cada vez más potentes.

Presentaba agentes capaces de investigar, utilizar herramientas, ejecutar acciones y completar tareas en nombre del usuario.

La conversación seguía siendo importante.

Pero dejaba de ser el objetivo principal.

Anthropic

Anthropic llegó a conclusiones muy parecidas.

En lugar de centrar el debate en qué modelo era más inteligente, comenzó a publicar recomendaciones sobre cómo construir agentes efectivos, insistiendo en aspectos como el uso de herramientas, la planificación y la composición de flujos de trabajo.

El énfasis ya no estaba en el modelo.

Estaba en el sistema.

Microsoft y el concepto de Digital Labor

Microsoft fue todavía más lejos.

Satya Nadella empezó a hablar de Digital Labor, una expresión que me parece especialmente reveladora, y que todavía no ha explotado poero parece que va todo por este camino.

Porque deja de comparar la inteligencia artificial con un buscador o con un chatbot.

Empieza a compararla con un trabajador.

La pregunta ya no es si un modelo responde correctamente.

La pregunta es qué parte del trabajo puede asumir de forma fiable.

Salesforce y Agentforce

Salesforce también siguió esa dirección con Agentforce.

En lugar de presentar un nuevo asistente conversacional, presentó agentes especializados para ventas, atención al cliente, marketing o comercio.

Cada uno con un objetivo concreto.

Cada uno con unas responsabilidades claramente definidas.

Todos parecen hablar de lo mismo

Cuanto más observo la evolución del sector, más difícil me resultaba pensar que todo aquello fuera una coincidencia.

Cada empresa utilizaba una terminología distinta.

Pero todas parecían describir exactamente el mismo cambio de paradigma.

Empresa	Cómo lo describe	Qué significa realmente
Andrew Ng	Agentic Workflows	Sistemas que planifican, utilizan herramientas y colaboran para alcanzar un objetivo.
Google	Customer Agents / Employee Agents	Agentes especializados para resolver responsabilidades concretas dentro de una organización.
OpenAI	Agents	Sistemas capaces de realizar tareas en nombre del usuario.
Anthropic	Effective Agents	Agentes construidos alrededor de herramientas y flujos de trabajo, no solo de conversaciones.
Microsoft	Digital Labor	Trabajadores digitales capaces de asumir parte del trabajo humano.
Salesforce	Agentforce	Equipos de agentes especializados para procesos empresariales.

Llegados a este punto empiezo a comprender que la industria ya no estaba compitiendo únicamente por construir el mejor modelo de lenguaje.

Esta compitiendo por construir el mejor trabajador digital.

Y esa diferencia cambia la forma de entender la inteligencia artificial.

Porque, visto así, un agente deja de ser simplemente un chatbot más inteligente.

Empieza a parecerse mucho más a un compañero capaz de asumir una responsabilidad dentro de una organización.

¿Qué es realmente un agente?

Después de recorrer toda esta evolución creo que hoy definiría un agente de una forma mucho más sencilla de lo que habría hecho hace dos años.

No hablaría de modelos.

No hablaría de frameworks.

No hablaría de arquitecturas.

Diría simplemente:

Un agente es un sistema capaz de asumir una responsabilidad y trabajar para cumplirla.

Esa definición parece simple.

Pero cambia completamente la perspectiva.

Hasta ahora hablábamos de modelos capaces de responder preguntas.

Ahora empezamos a hablar de sistemas capaces de hacerse cargo de una parte del trabajo.

Y esa diferencia es enorme.

Porque una responsabilidad implica algo más que una conversación.

Implica un objetivo.

Implica recordar qué se está haciendo.

Implica utilizar herramientas cuando es necesario.

Implica comprobar si el trabajo ha terminado correctamente.

Implica actuar incluso cuando nadie está escribiendo un prompt.

Eso es exactamente lo que empezamos a ver en los agentes modernos.

Y también explica por qué hoy muchas empresas hablan de trabajadores digitales y no simplemente de asistentes conversacionales.

De automatizaciones a responsabilidades

Creo que una forma sencilla de entender esta evolución es observar cómo ha cambiado aquello que delegamos en la tecnología.

Nivel	Qué hace	Qué delegamos
Automatización	Ejecuta reglas previamente definidas.	Una tarea repetitiva.
Chatbot	Mantiene una conversación utilizando lenguaje natural.	La interacción con el usuario.
Asistente IA	Comprende el contexto, consulta información y utiliza herramientas bajo petición.	Parte del trabajo intelectual.
Agente IA	Planifica, utiliza herramientas, toma decisiones dentro de unos límites y trabaja para alcanzar un objetivo.	Una responsabilidad concreta.
Agente Proactivo	Vigila continuamente, detecta cambios, prioriza información y decide cuándo debe intervenir.	Una responsabilidad permanente.

Esta tabla resume, probablemente mejor que cualquier definición académica, cómo ha evolucionado la inteligencia artificial durante los últimos años.

No hemos pasado simplemente de modelos menos inteligentes a modelos más inteligentes.

Hemos pasado de delegar tareas a delegar responsabilidades.

Y esa diferencia cambia completamente la forma de diseñar software.

Cuando pienso en OpenCTO no imagino un chatbot sobre servidores.

Imagino un responsable de infraestructura que vigila el estado del sistema, detecta vulnerabilidades y me avisa únicamente cuando merece la pena interrumpirme.

Cuando pienso en OpenCIO no imagino otro asistente conversacional.

Imagino alguien que sigue oportunidades comerciales, proyectos y presupuestos, y que detecta bloqueos antes incluso de que yo los vea.

Cuando pienso en OpenCMO no imagino una IA escribiendo publicaciones para LinkedIn.

Imagino un sistema que observa la actividad comercial, detecta nuevas oportunidades y propone acciones antes de que yo se las pida.

La diferencia no está en la conversación.

Está en la responsabilidad.

¿Dónde encaja RAG?

Esta es probablemente una de las preguntas que más confusión genera actualmente.

La respuesta corta es sencilla.

RAG no es un agente.

RAG (Retrieval-Augmented Generation) es una técnica que permite a un modelo consultar información externa antes de generar una respuesta.

En otras palabras, amplía el conocimiento disponible para el modelo.

Pero no le proporciona objetivos.

No le asigna responsabilidades.

No le permite decidir qué debe hacer a continuación.

Un agente puede utilizar RAG.

De hecho, muchos de los agentes más útiles lo hacen.

Pero del mismo modo que un ser humano utiliza Google, una base de datos o un manual técnico para realizar su trabajo.

La herramienta no convierte a la persona en un agente.

Simplemente aumenta su capacidad.

En mi caso he utilizado RAG sobre todo en proyectos relacionados con documentación técnica industrial, donde disponer de la información correcta resulta mucho más importante que memorizarla. Si te interesa este enfoque puedes profundizar en artículos como:

Por eso hoy me gusta pensar en un agente como la combinación de varias capacidades.

El LLM aporta razonamiento.

RAG aporta conocimiento.

Las herramientas permiten actuar.

La memoria proporciona continuidad.

Y el agente coordina todas esas piezas para cumplir una responsabilidad.

Quizá esa sea la mejor forma de entender la IA Agentic.

No como una nueva tecnología.

Sino como una nueva forma de organizar tecnologías que ya conocíamos para que puedan trabajar por nosotros.

La próxima década de la IA

Más allá de los modelos

Durante los últimos años hemos vivido una carrera frenética por construir modelos cada vez más potentes. Cada pocos meses aparecía un nuevo modelo con mejores puntuaciones en los benchmarks, una ventana de contexto más amplia o una mayor capacidad de razonamiento. Era lógico que toda la atención estuviera puesta en esa competición, porque por primera vez las máquinas parecían comprender el lenguaje con una naturalidad que hasta entonces resultaba inimaginable.

Sin embargo, tengo la impresión de que estamos llegando a un punto de inflexión. Los modelos seguirán mejorando, sin duda, pero cada vez tengo más claro que la verdadera diferenciación ya no vendrá únicamente de quién construya el mejor LLM. Del mismo modo que hoy elegimos un sistema operativo o una base de datos sin pensar constantemente en los algoritmos que utilizan internamente, llegará un momento en que los modelos de lenguaje serán una infraestructura más sobre la que construiremos aplicaciones mucho más interesantes.

La verdadera innovación empezará a producirse en la forma en que esos modelos colaboran entre sí, utilizan herramientas, acceden al conocimiento de una organización y asumen responsabilidades concretas dentro de un proceso de negocio. En otras palabras, la inteligencia dejará de medirse únicamente por la calidad de una respuesta para empezar a medirse por el valor del trabajo que un sistema es capaz de realizar de forma autónoma.

La economía de las responsabilidades

Si esa visión es correcta, creo que la próxima década no estará marcada únicamente por una revolución tecnológica. Estará marcada por una transformación profunda de la organización del trabajo.

Durante la Revolución Industrial aprendimos a delegar el esfuerzo físico en las máquinas. Más tarde empezamos a delegar cálculos, almacenamiento de información y tareas repetitivas en los ordenadores. Ahora estamos empezando a delegar parte del trabajo intelectual.

Pero el siguiente paso no consiste simplemente en pedirle a una inteligencia artificial que escriba un correo, traduzca un documento o resuma una reunión. Eso ya lo hace extraordinariamente bien.

La verdadera transformación llegará cuando empecemos a asignar responsabilidades completas a sistemas inteligentes. No una tarea aislada, sino un objetivo que deberá perseguirse de forma continuada. Vigilar la infraestructura tecnológica de una empresa, detectar vulnerabilidades antes de que se conviertan en un problema, seguir la evolución de una oportunidad comercial, mantener actualizada una base de conocimiento o supervisar el cumplimiento de determinados procesos son ejemplos de responsabilidades que hasta hace poco parecían exclusivamente humanas y que empiezan a ser asumibles por agentes especializados.

Quizá por eso Microsoft habla de Digital Labor, OpenAI de agentes, Google de Customer Agents y Employee Agents, Salesforce de Agentforce y Andrew Ng de Agentic Workflows. Todos utilizan un lenguaje diferente, pero tengo la sensación de que están describiendo el mismo fenómeno desde perspectivas distintas.

¿Qué estamos dispuestos a delegar?

Creo que esa será la gran pregunta de los próximos años.

No discutiremos únicamente qué modelo es mejor o qué empresa lidera el siguiente benchmark. Esas seguirán siendo cuestiones importantes para investigadores e ingenieros, pero para la mayoría de las organizaciones la pregunta será otra mucho más práctica.

¿Qué responsabilidades estamos dispuestos a delegar?

La respuesta será diferente para cada empresa, para cada profesional e incluso para cada momento histórico. Habrá responsabilidades que seguiremos queriendo asumir personalmente y otras que delegaremos encantados si un sistema demuestra ser fiable, transparente y capaz de justificar sus decisiones.

Desde mi punto de vista, ahí reside el verdadero reto de la IA Agentic. No se trata de construir máquinas que sustituyan a las personas, sino de diseñar sistemas capaces de hacerse cargo de aquellas responsabilidades que nos permitan dedicar más tiempo a las decisiones, a la creatividad, a la estrategia y, en definitiva, a aquello que aporta un mayor valor.

Mi viaje en la IA

Cuando empecé a escribir sobre Machine Learning nunca imaginé que acabaría escribiendo sobre agentes capaces de vigilar servidores, seguir oportunidades comerciales o mantener conversaciones prácticamente indistinguibles de las de un ser humano. Si releo los artículos que he publicado durante estos años, veo una evolución que en aquel momento no era consciente de estar recorriendo. Cada uno de ellos respondía a una pregunta distinta, pero todos formaban parte de la misma búsqueda.

Hoy creo que esa búsqueda me ha llevado a una conclusión mucho más sencilla de lo que habría imaginado.

Durante demasiado tiempo hemos pensado que la evolución de la inteligencia artificial consistía únicamente en construir modelos cada vez más inteligentes. Sin embargo, cuanto más observo la dirección que está tomando el sector, más convencido estoy de que la verdadera transformación consiste en otra cosa. Consiste en construir sistemas capaces de asumir responsabilidades cada vez mayores, de trabajar junto a nosotros, de utilizar herramientas, de acceder al conocimiento adecuado y de actuar cuando realmente hace falta.

Quizá por eso me gusta resumir toda esta evolución en una frase muy sencilla.

Los modelos responden preguntas. Los agentes asumen responsabilidades.

Y sospecho que esa diferencia marcará buena parte de la próxima década.

Al mirar hacia atrás, tanto mi propio recorrido como la evolución de la industria me producen una sensación curiosa. Durante un tiempo pensé que el concepto de agente había desaparecido, eclipsado por la enorme atención que recibían los modelos de lenguaje. Hoy creo que simplemente estaba evolucionando en silencio, esperando a que todas las piezas terminaran de encajar.

Quizá el agente no estaba muerto. Estaba de parranda.Y, mientras tanto, muchos de nosotros también recorríamos el camino necesario para entender que la próxima revolución de la inteligencia artificial no consistía en conversar mejor, sino en aprender a trabajar con ella.

Chatbot vs Agente IA: de conversaciones a delegar responsabilidades