Un año de IA agéntica: Seis lecciones de quienes están haciendo el trabajo

| Artículo

Nota: Hacemos nuestro mejor esfuerzo por preservar el espíritu original y los matices de nuestros artículos. Sin embargo, nos disculpamos de antemano por cualquier falla de traducción que pueda notar. Agradecemos sus comentarios en reader_input@mckinsey.com

A un año de la revolución de la inteligencia artificial (IA) agéntica, hay una lección clara: se necesita trabajar duro para hacerlo bien.

Más perspectivas de McKinsey en Español

Mire nuestra colección de artículos en Español y suscríbase a nuestro newsletter mensual en Español.

Navegue por la colección

Una transformación empresarial agéntica promete una productividad sin igual. Aunque algunas empresas están disfrutando de los primeros éxitos con estas actividades, a muchas otras les resulta difícil ver valor de sus inversiones. En algunos casos, incluso están recortando gastos y volviendo a contratar personas cuando los agentes han fracasado.

Estos tropiezos son una evolución natural de cualquier nueva tecnología, y ya hemos visto este patrón anteriormente con otras innovaciones. Para comprender las primeras lecciones, recientemente analizamos más de 50 desarrollos de IA agéntica que hemos liderado en McKinsey, así como docenas de otros en el mercado. Hemos resumido los resultados de nuestro análisis en seis lecciones para ayudar a los líderes a capturar con éxito el valor de la IA agéntica (vea el recuadro “¿Qué es la IA agéntica?”).

No se trata del agente, sino del flujo de trabajo

Para obtener valor empresarial con la IA agéntica es necesario cambiar los flujos de trabajo. Sin embargo, a menudo las organizaciones se centran demasiado en el agente o en la herramienta agéntica. Esto conduce inevitablemente a agentes de gran apariencia que, en realidad, no terminan mejorando el flujo de trabajo general, lo que da como resultado un valor decepcionante.

Los esfuerzos de IA agéntica que se enfocan en reimaginar fundamentalmente flujos de trabajo completos —es decir, los pasos que involucran a personas, procesos y tecnología— tienen más probabilidades de ofrecer resultados positivos. Comprender cómo los agentes pueden ayudar en cada uno de estos pasos es el camino hacia el valor. Las personas seguirán siendo fundamentales para realizar el trabajo, pero ahora contarán con diferentes agentes, herramientas y automatizaciones para apoyarlas.

Un punto de partida importante en el rediseño de los flujos de trabajo es mapear los procesos e identificar los principales puntos débiles para los usuarios. Este paso es crucial para diseñar sistemas agénticos que reduzcan el trabajo innecesario y permitan a los agentes y a las personas colaborar y alcanzar los objetivos empresariales de forma más eficiente y eficaz. Esa colaboración puede darse a través de bucles de aprendizaje y mecanismos de retroalimentación, creando un sistema que se refuerza a sí mismo. Cuanto más se utilizan los agentes, más inteligentes y alineados se vuelven.

Consideremos el caso de un proveedor de servicios jurídicos alternativos que estaba trabajando para modernizar sus flujos de trabajo de revisión de contratos. El razonamiento jurídico en el ámbito de la empresa estaba en constante evolución, con nueva jurisprudencia, matices jurisdiccionales e interpretaciones de políticas, lo que dificultaba la codificación de los conocimientos.

Para tener en cuenta la variabilidad natural, el equipo diseñó sus sistemas agénticos para que aprendieran dentro del flujo de trabajo. Por ejemplo, cada edición realizada por el usuario en el editor de documentos se registraba y clasificaba. Esto proporcionaba a los ingenieros y científicos de datos un rico flujo de retroalimentación, que luego podían utilizar para enseñar a los agentes, ajustar la lógica de las indicaciones y enriquecer la base de conocimientos. Con el tiempo, los agentes podían codificar nuevos conocimientos.

Centrarse en el flujo de trabajo en lugar de en el agente permitió a los equipos implementar la tecnología adecuada en el momento oportuno, lo que es especialmente importante cuando se rediseñan flujos de trabajo complejos y de múltiples pasos (ver Gráfica). Por ejemplo, las compañías de seguros suelen tener grandes flujos de trabajo de investigación que abarcan múltiples pasos (como la gestión de reclamaciones y la suscripción), y cada paso requiere diferentes tipos de actividades y tareas cognitivas. Las empresas pueden rediseñar este tipo de flujos de trabajo mediante la implementación cuidadosa de una combinación específica de sistemas basados en reglas, IA analítica, IA generativa y agentes, todo ello respaldado por un marco de coordinación común (como los marcos de código abierto AutoGen, CrewAI y LangGraph). En estos casos, los agentes son los orquestadores e integradores, que acceden a las herramientas e integran los resultados de otros sistemas en su contexto. Son el pegamento que unifica el flujo de trabajo para que ofrezca un cierre real con menor necesidad de intervención.

Los agentes no siempre son la respuesta

Los agentes de IA pueden hacer mucho, pero no deberían usarse necesariamente para todo. Con demasiada frecuencia, los líderes no examinan con suficiente detenimiento el trabajo que hay que realizar ni se preguntan si un agente sería la mejor opción para llevarlo a cabo.

Para evitar inversiones innecesarias o una complejidad indeseada, los líderes empresariales pueden abordar el papel de los agentes de forma muy similar a como lo hacen cuando evalúan a las personas para un equipo de alto rendimiento. La pregunta clave es: “¿Cuál es el trabajo que hay que realizar y cuáles son los talentos relativos de cada miembro potencial del equipo –o agente– para trabajar juntos y alcanzar esos objetivos?”. Los problemas empresariales a menudo pueden abordarse con enfoques de automatización más sencillos, como la automatización basada en reglas, el análisis predictivo o los prompts de grandes modelos de lenguaje (large language models, o LLM), que pueden ser más fiables que los agentes listos para usar.

Antes de precipitarse con una solución agéntica, los líderes empresariales deben evaluar las exigencias de la tarea. En la práctica, esto significa tener claro hasta qué punto debe estar estandarizado el proceso, cuánta variabilidad debe manejar y qué partes del trabajo son más adecuadas para los agentes.

En cierto nivel, estas cuestiones son sencillas. Por ejemplo, los flujos de trabajo con baja variabilidad y alta estandarización, como la incorporación de inversionistas o las divulgaciones regulatorias, tienden a estar estrictamente regulados y seguir una lógica predecible. En estos casos, los agentes basados en LLM no deterministas podrían añadir más complejidad e incertidumbre que valor.

Por el contrario, los flujos de trabajo con alta variabilidad y baja estandarización podrían beneficiarse significativamente de los agentes. Por ejemplo, se desplegaron agentes en una empresa de servicios financieros para extraer información financiera compleja, lo que redujo la cantidad de validación humana necesaria y agilizó los flujos de trabajo. Estas tareas exigían agregación de información, comprobaciones de verificación y análisis de cumplimiento, tareas en las que los agentes pueden ser eficaces.

Lo importante es no quedarse atrapado en una mentalidad binaria de “agente/no agente”. Algunos agentes pueden realizar bien tareas específicas, otros pueden ayudar a las personas a hacer mejor su trabajo y, en muchos casos, puede que sean más adecuadas tecnologías completamente diferentes. La clave está en averiguar qué herramienta o agente se adapta mejor a la tarea, cómo pueden las personas trabajar con ellos de la forma más eficaz y cómo deben combinarse los agentes y los trabajadores para obtener el máximo rendimiento. La eficacia de la colaboración entre personas, agentes y herramientas es la salsa secreta para obtener valor (vea el recuadro “Tenga en cuenta estas reglas generales de alto nivel al considerar qué herramientas de IA utilizar”).

Detenga la ‘IA descuidada’: Invierta en evaluaciones y genere confianza en los usuarios

Uno de los escollos más comunes con los que se encuentran los equipos al implementar agentes de IA son los sistemas agénticos que parecen impresionantes en las demostraciones, pero que frustran a los usuarios que realmente son responsables del trabajo. Es común escuchar a los usuarios quejarse de la “IA descuidada” o de los resultados de baja calidad. Los usuarios pierden rápidamente la confianza en los agentes y los niveles de adopción son bajos. Cualquier ganancia de la eficiencia lograda mediante la automatización puede verse fácilmente contrarrestada por una pérdida de confianza o una disminución de la calidad.

Una lección aprendida con esfuerzo de este problema recurrente es que las empresas deben invertir mucho en el desarrollo de los agentes, al igual que lo hacen con el desarrollo de los empleados. Como nos dijo un líder empresarial: “Incorporar agentes es más como contratar a un nuevo empleado que como implementar software”. Los agentes deben recibir descripciones claras de sus funciones, ser incorporados y recibir retroalimentación continua para que sean más eficaces y mejoren regularmente.

Desarrollar agentes eficaces es una tarea compleja que requiere aprovechar la experiencia individual para crear evaluaciones (o “evals”) y codificar las mejores prácticas con el suficiente detalle para tareas específicas. Esta codificación sirve tanto como manual de entrenamiento como prueba de rendimiento para el agente, garantizando que funcione según lo esperado.

Estas prácticas pueden existir en los procedimientos operativos estándar o como conocimiento tácito en la mente de las personas. Al codificar las prácticas, es importante centrarse en lo que diferencia a los mejores empleados del resto. En el caso de los representantes de ventas, esto podría incluir cómo dirigen la conversación, manejan las objeciones y se adaptan al estilo del cliente (vea el recuadro “Tipos de evaluación”).

Es fundamental que los expertos sigan participando para evaluar el rendimiento de los agentes a lo largo del tiempo; en este ámbito no puede haber un “lanzamiento y abandono” (“launch and leave”). Este compromiso con la evaluación requiere, por ejemplo, que los expertos anoten o etiqueten literalmente los resultados deseados (y quizás no deseados) para determinadas entradas, que a veces pueden ascender a miles en el caso de los agentes más complejos. De este modo, los equipos pueden evaluar en qué medida un agente acertó o se equivocó, y realizar las correcciones necesarias.

Un banco global tomó en serio este enfoque al transformar sus procesos de conocimiento del cliente y de análisis del riesgo crediticio. Cada vez que la recomendación del agente sobre el cumplimiento de las directrices de admisión difería del juicio humano, el equipo identificaba las lagunas lógicas, refinaba los criterios de decisión y repetía las pruebas.

En un caso, por ejemplo, el análisis inicial de los agentes era demasiado general. El equipo dio esa retroalimentación y luego desarrolló y desplegó agentes adicionales para garantizar que la profundidad del análisis proporcionara información útil con el nivel de detalle adecuado. Una forma de hacerlo fue preguntar a los agentes “¿por qué?” varias veces seguidas. Este enfoque garantizó el buen rendimiento de los agentes, lo que aumentó considerablemente la probabilidad de que las personas aceptaran sus resultados.

Facilite el seguimiento y la verificación de cada paso

Cuando se trabaja con pocos agentes de IA, revisar su trabajo y detectar errores puede ser bastante sencillo. Pero a medida que las empresas implementan cientos, o incluso miles, de agentes, la tarea se vuelve más compleja. El problema se agrava porque muchas empresas rastrean solo los resultados. Por lo tanto, cuando se produce un error —y siempre habrá errores a medida que las empresas amplían el número de agentes—, es difícil determinar con precisión qué falló.

El rendimiento de los agentes debe verificarse en cada paso del flujo de trabajo. Integrar la supervisión y la evaluación en el flujo de trabajo permite a los equipos detectar errores de forma temprana, perfeccionar la lógica y mejorar continuamente el rendimiento, incluso después de que los agentes hayan sido desplegados.

Por ejemplo, en un flujo de trabajo de revisión de documentos, el equipo de producto de un proveedor de servicios jurídicos alternativos observó una caída repentina en la precisión cuando el sistema se encontró con un nuevo conjunto de casos. Sin embargo, como habían creado el flujo de trabajo agéntico con herramientas de observabilidad para realizar un seguimiento de cada paso del proceso, el equipo identificó rápidamente el problema: ciertos segmentos de usuarios estaban enviando datos de menor calidad, lo que daba lugar a interpretaciones incorrectas y recomendaciones posteriores deficientes.

Con esa información, el equipo mejoró sus prácticas de recopilación de datos, proporcionó directrices de formato de documentos a las partes interesadas y ajustó la lógica de análisis del sistema. El rendimiento de los agentes se recuperó rápidamente.

El mejor caso de uso es el caso de reutilización

En su afán por avanzar con la IA agéntica, las empresas suelen crear un agente único para cada tarea identificada. Esto puede dar lugar a una redundancia y desperdicio significativos, ya que el mismo agente puede a menudo realizar diferentes tareas que comparten muchas de las mismas acciones (como ingerir, extraer, buscar y analizar).

Decidir cuánto invertir en la creación de agentes reutilizables (frente a un agente que ejecuta una tarea específica) es análogo al problema clásico de la arquitectura de TI, en el que las empresas necesitan construir rápidamente, pero sin limitarse a opciones que restrinjan las capacidades futuras. Lograr ese equilibrio suele requerir mucho criterio y análisis.

Identificar las tareas recurrentes es un buen punto de partida. Las empresas pueden desarrollar agentes y componentes de agentes que se puedan reutilizar en diferentes flujos de trabajo y facilitar el acceso a ellos a los desarrolladores. Esto incluye desarrollar un conjunto centralizado de servicios validados (como la observabilidad de LLM o los prompts preaprobados) y activos (por ejemplo, patrones de aplicación, código reutilizable y materiales de formación) que sean fáciles de localizar y utilizar. Es fundamental integrar estas capacidades en una plataforma única. Según nuestra experiencia, esto ayuda a eliminar prácticamente entre el 30 y 50 por ciento del trabajo no esencial que se requiere normalmente.

Los seres humanos siguen siendo esenciales, pero sus funciones y su número cambiarán

A medida que los agentes de IA siguen proliferando, la pregunta sobre qué función desempeñarán los seres humanos ha generado mucha ansiedad: por un lado, sobre la seguridad laboral y, por otro, sobre las altas expectativas de aumento de la productividad. Esto ha dado lugar a opiniones muy divergentes sobre el papel de los seres humanos en muchos puestos de trabajo actuales.

Para ser claros: los agentes podrán lograr mucho, pero los seres humanos seguirán siendo una parte esencial de la ecuación de la fuerza laboral, incluso si el tipo de trabajo que realizan tanto los agentes como los seres humanos cambia con el tiempo. Las personas tendrán que supervisar la precisión de los modelos, garantizar el cumplimiento, usar su criterio y gestionar los casos extremos, por ejemplo. Y, como ya comentamos, los agentes no siempre serán la mejor solución, por lo que se necesitarán personas que trabajen con otras herramientas, como los modelos de aprendizaje automático. Sin embargo, es probable que el número de personas que forman parte de un flujo de trabajo concreto cambie y, a menudo, sea menor una vez que ese flujo se haya transformado mediante el uso de agentes. Los líderes empresariales tendrán que gestionar estas transiciones como lo harían con cualquier programa de cambio y asignar cuidadosamente el trabajo necesario para capacitar y evaluar a los agentes.

Otra gran lección que hemos aprendido de nuestra experiencia es que las empresas deben rediseñar el trabajo de forma deliberada para que las personas y los agentes puedan colaborar bien juntos. Sin ese enfoque, incluso los programas agénticos más avanzados corren el riesgo de sufrir fallos silenciosos, errores compuestos y el rechazo de los usuarios.

Tomemos el ejemplo del proveedor de servicios jurídicos alternativos mencionado anteriormente, que quería usar agentes para un flujo de trabajo de análisis legal. Al diseñar el flujo de trabajo, el equipo se tomó el tiempo necesario para identificar dónde, cuándo y cómo integrar la aportación humana. En un caso, los agentes pudieron organizar las reclamaciones principales y los importes en dólares con altos niveles de precisión, pero era importante que los abogados las revisaran y aprobaran, dada la importancia de las reclamaciones para todo el caso.

Del mismo modo, los agentes pudieron recomendar enfoques de planes de trabajo para un caso, pero dada la importancia de la decisión, era esencial que las personas no solo revisaran, sino que también ajustaran la recomendación. Los agentes también se programaron para resaltar los casos extremos y las anomalías, lo que ayudó a los abogados a desarrollar una visión más completa. Alguien aún tenía que firmar el documento al final del proceso, respaldando la decisión legal con su licencia y credenciales.

Una parte importante de este diseño colaborativo entre humanos y agentes es el desarrollo de interfaces de usuario visuales sencillas que faciliten la interacción de las personas con los agentes. Por ejemplo, una compañía de seguros de propiedad y accidentes desarrolló elementos visuales interactivos (como cuadros delimitadores, resaltados y desplazamiento automático) para ayudar a los revisores a validar rápidamente los resúmenes generados por la IA. Al hacer clic en una idea, por ejemplo, la aplicación se desplazaba directamente a la página correcta y resaltaba el texto apropiado. Este enfoque en la experiencia del usuario ahorró tiempo, redujo las dudas y generó confianza en el sistema, lo que llevó a unos niveles de aceptación por parte de los usuarios cercanos al 95 por ciento.


El mundo de los agentes de IA avanza rápidamente, por lo que podemos esperar aprender muchas lecciones más. Sin embargo, a menos que las empresas aborden sus programas agénticos teniendo en cuenta el aprendizaje (y poniéndolo en práctica), es probable que repitan errores y ralenticen su progreso.

Explore a career with us