Desbloquear el valor de la IA en el desarrollo de software

Nota: Hacemos nuestro mejor esfuerzo por preservar el espíritu original y los matices de nuestros artículos. Sin embargo, nos disculpamos de antemano por cualquier falla de traducción que pueda notar. Agradecemos sus comentarios en reader_input@mckinsey.com

A pesar de todos los avances tecnológicos del software y de sus impactos que han cambiado el mundo durante el último medio siglo, su potencial sísmico ha estado históricamente limitado por la escasez de desarrolladores cualificados, la capacidad finita de codificación y la complejidad de coordinar proyectos de gran escala. El surgimiento de la inteligencia artificial (IA) generativa y, más recientemente, de la IA agéntica, debía –y debe– superar estos obstáculos, dando lugar a una nueva productividad y creación de valor incalculables. Si bien muchas organizaciones ya están viendo algún impacto positivo de estas herramientas, un pequeño subconjunto de empresas está obteniendo ganancias particularmente grandes. Ese es uno de los hallazgos clave de una reciente encuesta de McKinsey a una amplia variedad de casi 300 empresas que cotizan en bolsa.

Para ayudar a comprender qué distingue a las organizaciones de software impulsadas por IA con mejor desempeño, evaluamos los niveles de adopción de IA, los resultados y las prácticas entre desarrolladores y profesionales de gestión de producto (vea el recuadro “Acerca de la investigación”). Las organizaciones de mayor rendimiento observaron un impacto notablemente grande de la IA en cuatro métricas clave de desarrollo: productividad del equipo, experiencia del cliente y tiempo de lanzamiento al mercado (con mejoras del 16 al 30 por ciento), así como calidad del software (del 31 al 45 por ciento). Nuestra investigación muestra que materializar la promesa revolucionaria de la IA en el desarrollo de productos de software requerirá mucho más que la adopción: exigirá una revisión completa de los procesos, las funciones y las formas de trabajar para mantener el ritmo ante la creciente inteligencia de las herramientas y los modelos. Este artículo analiza dos cambios clave y tres habilitadores esenciales que las organizaciones de software de alto rendimiento utilizan para maximizar el potencial de incorporar la IA en el desarrollo de software.

¿Qué distingue a los líderes de software impulsado por IA?

Acerca de la investigación

Nuestra metodología de encuesta abarcó cinco dimensiones centrales del modelo operativo de producto: estructura, estrategia y gobernanza, formas de trabajo, cultura y talento, y herramientas. Consultamos a casi 300 líderes sénior de empresas que cotizan en bolsa sobre la adopción y las prácticas de IA, y 100 de ellos evaluaron el impacto y el desempeño en cuatro resultados: calidad del software, tiempo de lanzamiento al mercado, productividad del equipo y experiencia del cliente. Los de mejor desempeño se definieron como el quintil superior de los encuestados en las cuatro métricas de resultados, mientras que los de peor desempeño se definieron como el quintil inferior, con los tres quintiles intermedios definidos como desempeño medio. Los encuestados representaban múltiples sectores (incluidos tecnología, servicios financieros, salud, energía y comercio minorista) y geografías (las Américas, Asia y Europa), lo que proporciona una visión integral de cómo las organizaciones están integrando la IA en el desarrollo de productos.

Los líderes que moldean activamente una adopción madura de la IA como parte del desarrollo de software están viendo resultados materiales, con una brecha de rendimiento de 15 puntos porcentuales entre los de mejor y peor desempeño. El alto rendimiento se caracteriza por una mayor coherencia y calidad de los artefactos, ciclos de sprint más cortos, equipos más pequeños y puntuaciones de satisfacción del cliente más altas. Para entender qué impulsa este rendimiento superior, examinamos más de cerca los modelos operativos de este grupo. Identificamos dos cambios clave, respaldados por tres habilitadores críticos, que los diferencian de manera consistente. Casi dos tercios de los de mejor desempeño utilizaron al menos tres de estos cinco factores, en comparación con solo el 10 por ciento de sus pares de menor desempeño (Gráfica).

Los equipos de software de mayor desempeño utilizan una combinación de cambios en los procesos y habilitadores clave para generar un mayor impacto de la IA

En conjunto, estos cinco elementos muestran que la simple adopción de herramientas de IA no es suficiente. Las empresas deben replantear cómo estructuran los equipos y cómo desarrollan software en un mundo orientado a la IA.

Dos cambios clave para desbloquear todo el potencial de la IA en el desarrollo de software

Las organizaciones con mejor desempeño en el desarrollo de software impulsado por IA cierran la brecha entre la experimentación y el impacto incorporando dos prácticas que se refuerzan mutuamente a lo largo del ciclo de vida del desarrollo de productos (product development life cycle, o PDLC).

1. Priorizar implementaciones de casos de uso de extremo a extremo a lo largo del PDLC

Las organizaciones con mejor desempeño adoptan un enfoque holístico, incorporando la IA en todo el ciclo de vida del desarrollo en lugar de limitarse a casos de uso aislados. Tienen entre seis y siete veces más probabilidades que sus pares de escalar a cuatro o más casos de uso, desde el diseño y la codificación hasta las pruebas, el despliegue y el seguimiento de la adopción. Casi dos tercios de los líderes informan tener cuatro o más casos de uso a escala, en comparación con solo el 10 por ciento de los de menor desempeño.

Cursor, la start-up nativa de IA de rápido crecimiento, adopta un enfoque integral. El equipo de Cursor funciona efectivamente como un laboratorio interno para flujos de trabajo de ingeniería impulsados por IA, donde los equipos prueban soluciones a sus propios puntos de dolor y convierten en producto aquellas que ganan tracción. Los desarrolladores combinan agentes de IA, soporte de Bugbot y revisión humana para ampliar la cobertura de las tareas de software con una interrupción mínima, mientras que los sprints equilibran la entrega de nuevas funcionalidades con mejoras de procesos. Los ingenieros de Cursor establecen comandos de equipo, prompts y reglas en distintos niveles de alcance, ya sea para un archivo individual o para toda la base de código, según sus preferencias y las consideraciones de diseño de la organización, pasando de una documentación escasa a un “PDLC de camino pavimentado”. El equipo utiliza la función Plan Mode de su herramienta principal de codificación para trazar sus cambios antes de la implementación, comenzando con las solicitudes de funcionalidades de los clientes en el editor o directamente desde sus herramientas de comunicación interna.

Durante el desarrollo, los ingenieros colaboran con agentes en tiempo real, incluso mediante voz, para refactorizar código, hacer preguntas sobre su base de código y crear funcionalidades. Al mismo tiempo, activan agentes en segundo plano para que se encarguen de otras tareas, en ocasiones ejecutando varios agentes localmente en paralelo sobre la misma tarea y evaluando después la mejor salida directamente dentro del editor. Esta configuración permite que el equipo cambie sin interrupciones entre su trabajo actual y las tareas que han delegado en el agente en segundo plano, a menudo retomando donde el agente lo dejó. Para el diseño y las pruebas iterativas, los ingenieros controlan y muestran un navegador web dentro de su editor para visualizar los cambios durante el desarrollo, lo que les permite auditar la accesibilidad, convertir diseños en código y proporcionar retroalimentación visual durante la depuración. Bugbot, la herramienta de revisión de código de IA de Cursor, examina el código resultante antes de que se pase a otros desarrolladores del equipo para una comprobación final, lo que añade una capa adicional de validación a cualquier software previo a la producción. En conjunto, este nuevo flujo de trabajo de desarrollo permite a Cursor aumentar su producción de funcionalidades con un equipo reducido.¹

2. Crear roles nativos de IA dentro del PDLC

La IA está asumiendo cada vez más tareas fundamentales de ingeniería, como la refactorización, la modernización y las pruebas, lo que marca una evolución desde ayudas de codificación asistidas hasta colaboradores plenamente integrados que se expanden a lo largo del PDLC. Más del 90 por ciento de todos los equipos de software encuestados utilizan la IA para estas actividades, ahorrando un promedio de seis horas semanales. Sin embargo, a medida que el crecimiento del número de ingenieros se ralentiza, se espera que los desarrolladores combinen la fluidez técnica con la comprensión del producto, el diseño y el negocio. Esto es posible gracias a herramientas más potentes con una mejor orquestación, como pasar de autocompletados básicos a agentes impulsados por razonamiento que planean tareas, con el apoyo de una mayor información contextual. Por ejemplo, herramientas como GitHub Copilot, Claude Code y el agente Jules de Google, entre otras, han evolucionado de simples autocompletados en línea (inline completions) hasta la ejecución autónoma de tareas de refactorización y modernización de larga duración y de múltiples archivos.

Como parte de esta adopción, los roles clave están asumiendo nuevas responsabilidades nativas de IA. Los gestores de producto, por ejemplo, dedican menos tiempo a la entrega de funcionalidades y más al diseño, la creación de prototipos, el aseguramiento de la calidad (quality assurance, o QA) y las prácticas de implementación responsable de IA. Por su parte, los ingenieros de software se centran más en la fluidez full-stack, la comunicación estructurada de especificaciones y la comprensión de las compensaciones arquitectónicas y de sistemas. Ambos roles están desarrollando nuevas habilidades específicas de IA que amplían sus fortalezas tradicionales: habilidades en áreas como escalabilidad, seguridad y pruebas para los desarrolladores, y estrategia, conocimiento del cliente y gobernanza para los gestores de producto. De cara al futuro, muchos equipos podrían operar como orquestadores de agentes de IA paralelos y asíncronos, asignando flujos de trabajo y dando forma a la lógica de extremo a extremo en conjunto, mientras verifican continuamente los resultados. Las empresas crearán cada vez más software a demanda (por ejemplo, herramientas internas generadas por los usuarios), lo que hará que la definición de problemas y la especificación de intención sean habilidades críticas y que las organizaciones se orienten hacia modelos más centrados en el producto.

Más perspectivas de McKinsey en Español

Mire nuestra colección de artículos en Español y suscríbase a nuestro newsletter mensual en Español.

Navegue por la colección

La estructura del equipo de Cursor refleja cómo los roles nativos de IA requieren cambios de habilidades en todo el PDLC. Los límites tradicionales entre front-end, back-end y QA se han fusionado en responsabilidades full-stack más amplias. Cada versión cuenta con una persona responsable dedicada (dedicated responsible individual, o DRI) que coordina el desarrollo, las pruebas y la resolución de errores. Los gestores de producto prueban las funcionalidades internamente, los diseñadores crean prototipos directamente en código y los equipos de negocio y datos utilizan la plataforma para consultar datos del producto. Dentro del aprendizaje automático (machine learning, o ML), la infraestructura y el producto, los pods son pequeños y los proyectos suelen abarcar varios equipos. “Durante la próxima década, la programación asistida por IA permitirá a los desarrolladores especificar la intención mediante una combinación de lenguajes de programación formales y lenguaje natural, liberándolos para centrarse en diseñar la lógica de su software”, dice Michael Truell, CEO y cofundador de Cursor. “Algunos colaboradores individuales podrían dedicar parte de su tiempo a actuar como gestores de ingeniería, dirigiendo un equipo júnior de agentes asíncronos: un nuevo tipo de trabajo que podría exigir un conjunto de habilidades completamente nuevo. Es probable que la IA desempeñe un papel importante en la revisión y las pruebas de código, y la validación se acelerará exponencialmente.”

Tres habilitadores críticos del éxito

Por esenciales que sean, los cambios en estas dos prácticas por sí solos no son suficientes para capturar todo el valor de la IA en el desarrollo de productos de software. Las organizaciones con mejor desempeño refuerzan estos cambios con tres habilitadores críticos: mejora de competencias, medición del impacto y gestión del cambio, que garantizan que la adopción se traduzca en mejoras de rendimiento sostenidas.

1. Mejora de competencias: Invertir en formación personalizada e intensiva

Aunque la mayoría de las empresas están ofreciendo cursos a demanda, aquellas que invierten en talleres prácticos y tutorías individuales tienen muchas más probabilidades de ver mejoras cuantificables: el 57 por ciento de las de mejor desempeño frente a solo el 20 por ciento de las de peor desempeño. Mejorar las competencias de ingenieros y gestores de producto para usar la IA no es tan simple como proporcionarles una herramienta. Desglosar problemas para comunicarlos claramente a un gran modelo de lenguaje (large language model, LLM) –la ingeniería de prompts– es solo un ejemplo de la complejidad que requiere formación intensiva para elevar el nivel.

Las organizaciones de alto desempeño diseñan capacitaciones que reflejan el trabajo real de desarrollo –integrando la IA en las revisiones de código, la planeación de sprints y los ciclos de prueba– para que los equipos aprendan a aplicar la IA en contextos reales, no en simulaciones. También personalizan las rutas de aprendizaje según el rol, centrando a los desarrolladores en el diseño de prompts y la evaluación de modelos, mientras ayudan a los gestores de producto a desarrollar conocimientos sobre el comportamiento de los modelos, la gobernanza de datos y el uso responsable.

Dado el rápido avance de las herramientas, la capacitación no puede ser un ejercicio puntual. La documentación estática o las sesiones anuales pierden relevancia rápidamente. La tutoría continua y contextual, integrada en rituales como las retrospectivas, se ha convertido en un diferenciador clave. Algunas empresas líderes incluso han creado “gremios de IA” internos o “centros de habilitación” que seleccionan nuevos casos de uso, comparten las mejores prácticas y ofrecen mentoría bajo demanda para los equipos de proyectos.

En última instancia, la productividad depende tanto de la mentalidad y la colaboración como de las propias herramientas y tecnologías. Los equipos que convierten el aprendizaje en parte de la entrega –tratando cada sprint como una oportunidad para experimentar y perfeccionar– son los que traducen de forma consistente la adopción de la IA en un impacto empresarial medible.

2. Medición del impacto: Hacer seguimiento de los resultados, no solo de la adopción

Las organizaciones de alto desempeño saben que no basta con centrarse únicamente en métricas de adopción, como la frecuencia de uso de las herramientas o las tasas de aceptación del código. Estos líderes hacen un seguimiento de los resultados: supervisan las mejoras de calidad (79 por ciento) y las ganancias de velocidad (57 por ciento). Al responsabilizar a los equipos por el impacto, las organizaciones líderes mantienen el impulso y se ajustan rápidamente cuando es necesario, mientras que las de bajo desempeño se centran únicamente en métricas de adopción que, por sí solas, muestran poca correlación con el rendimiento. A medida que las herramientas evolucionan y permiten más capacidades (como generar código a partir de un documento de diseño), las métricas “estrella dorada” de impacto también evolucionarán, lo que obligará a las organizaciones a ser flexibles y adaptables. “Con demasiada frecuencia, las empresas miden el impacto de la IA contando cuánto código produce en lugar de lo que ese código consigue”, dice Tariq Shaukat, CEO de Sonar, creador de herramientas y soluciones de análisis de calidad de código. “Las líneas de código o los porcentajes de contribución de la IA no revelan si el resultado es seguro, mantenible o siquiera útil. El progreso real proviene de seguir cómo estas herramientas ayudan a los equipos a entregar software de mayor calidad y más confiable, no solo más cantidad.”

Medir eficazmente el impacto de la IA. Tres pasos pueden ayudar a construir un sistema de medición sólido:

Seleccionar métricas significativas. Definir los resultados que más importan, como tiempos de ciclo más rápidos, versiones de mayor calidad y mejor satisfacción del cliente. Evitar indicadores débiles como el porcentaje de código generado por IA, que ofrecen poca información sobre la productividad real. Superponer métricas de resultados (como productividad, velocidad y calidad) con métricas de entrada (como adopción de funcionalidades de IA o detección de defectos) para normalizar el impacto del progreso a lo largo del tiempo.
Construir un seguimiento integrado. Conectar datos a través de herramientas de planeación, repositorios de código y registros de uso de IA para crear una visión coherente del rendimiento. El seguimiento integrado ayuda a identificar cuellos de botella en el ciclo de desarrollo y garantiza que los equipos avancen hacia los resultados empresariales.
Informar sobre los hallazgos con regularidad. Compartir continuamente los hallazgos con los líderes de producto, ingeniería y negocio. Los informes periódicos destacan los éxitos, señalan los desafíos con anticipación y permiten realizar correcciones de rumbo coordinadas.

3. Gestión del cambio: Alinear los incentivos con los comportamientos habilitados por IA que impulsan el impacto

Las organizaciones con mejor desempeño incorporan directamente la adopción de la IA en las evaluaciones de rendimiento. Casi ocho de cada diez vinculan los objetivos relacionados con la IA generativa tanto a las revisiones de los gestores de producto como a las de los desarrolladores, en comparación con solo el 10 por ciento de las de peor desempeño en el caso de los desarrolladores y ninguna en el de los gestores de producto. Al alinear los objetivos individuales con la estrategia de IA de la organización, las empresas crean responsabilidad y animan a los empleados a integrar la IA en sus flujos de trabajo diarios.

Las organizaciones líderes centran los incentivos en los comportamientos que generan impacto, no solo en el uso. Los objetivos se enmarcan en contribuciones como identificar oportunidades de automatización, mejorar la velocidad mediante pruebas habilitadas por IA o aumentar la calidad mediante revisiones de código asistidas por modelos. Estas métricas basadas en el comportamiento crean la base para el impacto, evitando al mismo tiempo el riesgo de juzgar a las personas por resultados que no pueden controlar por completo.

Las organizaciones con mejor desempeño también esperan que los equipos conecten su trabajo habilitado por IA con resultados más amplios, como productividad, calidad o experiencia del cliente. Esto genera conciencia sobre el impacto sin vincular la compensación a métricas ajenas a la influencia individual. Integrar estas expectativas en los sistemas de rendimiento permite que las empresas vayan más allá de mandatos puntuales, convirtiendo la adopción de la IA en una capacidad organizativa sostenida que impulsa continuamente la innovación y el valor medible.

Avanzar hacia un verdadero valor impulsado por la IA

En los últimos dos años, muchas empresas han aprendido de primera mano que generar un impacto financiero real al incorporar la IA en el desarrollo de productos de software exige que las organizaciones realicen cambios integrales en su modelo operativo, adoptando nuevas prácticas y habilitadores críticos. Esta flexibilidad y capacidad de adaptación son esenciales, dada la rapidez con la que está evolucionando el ecosistema de codificación con IA, con nuevas herramientas que surgen cada pocos meses y una inteligencia de los modelos que avanza rápidamente. Tan solo en el último año, el benchmark de codificación con IA de Artificial Analysis² casi se ha duplicado –de 30 a 55 puntos–, aunque todavía está 20 puntos por debajo del índice general de inteligencia de todos los modelos generales, lo que demuestra que las herramientas de codificación con IA todavía tienen margen para volverse más inteligentes.³

Sin embargo, la inteligencia bruta es solo una parte de la historia. Las herramientas se están volviendo más potentes a medida que se expanden por todo el PDLC. Con una orquestación más sólida y una integración de sistemas más estrecha, están pasando de simples herramientas de autocompletado a agentes híbridos impulsados por razonamiento que pueden planear tareas, llamar a herramientas externas e incluso simular automáticamente pruebas de usuario mediante el uso de un navegador integrado, todo ello respaldado por un contexto más profundo.

Las organizaciones que trabajan para mantenerse al día con estos avances también deben empezar a replantearse las estructuras y prácticas necesarias para maximizar su impacto; implementar un cambio organizacional sostenible no ocurre de la noche a la mañana, incluso cuando las herramientas de IA avanzan a un ritmo vertiginoso. Las organizaciones de software que están liderando el camino en aprovechar la IA para lograr un impacto real están utilizando implementaciones audaces y de extremo a extremo que tratan la IA como un catalizador transformador para todo el proceso de desarrollo. Además de las prácticas y los habilitadores que hemos descrito en este artículo, estos líderes suelen seguir tres pasos generales: establecen objetivos ambiciosos que unen al liderazgo y energizan a la organización; desarrollan un plan holístico para el modelo operativo futuro, probado y perfeccionado para adaptarse al contexto de la organización; y crean una hoja de ruta detallada que redefine las estructuras de los equipos, los flujos de trabajo, las métricas y los incentivos para desbloquear la productividad a escala. Solo mediante un enfoque estratégico y exhaustivo de la IA podrán los equipos de software aprovechar todo su potencial como una fuerza para la innovación, la eficiencia y la creación de valor en el desarrollo de software.