O verdadeiro valor da IA no desenvolvimento de software

Observação: Nós nos empenhamos ao máximo para manter o espírito e as nuances originais de nossos artigos. Porém, pedimos desculpas desde já por quaisquer erros de tradução que você venha a notar. Seu feedback é bem-vindo através do e-mail reader_input@mckinsey.com

A despeito de todos de todos os avanços tecnológicos em software e das transformações que provocaram no mundo ao longo no último meio século, seu verdadeiro potencial sísmico sempre foi limitado pela escassez de desenvolvedores qualificados, pela capacidade finita de escrever código e pela complexidade de coordenar projetos de grande porte. O surgimento da IA generativa e, mais recentemente, da IA agêntica, certamente contribuirá para se superar esses obstáculos, abrindo caminho para níveis incalculáveis de produtividade e criação de valor. Embora muitas organizações já percebam os efeitos positivos dessas ferramentas, um pequeno subgrupo de empresas vem colhendo benefícios extraordinários. Esta é uma das principais conclusões de uma pesquisa recente da McKinsey com uma ampla gama de quase 300 empresas de capital aberto.

Com o intuito de entender o que distingue as melhores organizações de software que já utilizam inteligência artificial, analisamos seus níveis de adoção, os resultados obtidos e as práticas de desenvolvedores e gerentes de produtos (veja Box “Sobre a pesquisa”). Nas empresas de melhor desempenho, o impacto da IA foi bastante expressivo em quatro métricas fundamentais do desenvolvimento de software: produtividade das equipes, experiência do cliente, time-to-market (melhorias de 16% a 30%) e qualidade do software (melhorias 31% a 45%). Nossa pesquisa mostra que materializar a promessa revolucionária da IA no desenvolvimento de software exigirá muito mais do que simplesmente adotá-la: para acompanhar a aceleração da inteligência das ferramentas e dos modelos, as organizações terão de reformular completamente seus processos, funções e modos de trabalhar. Este artigo examina duas mudanças estruturais e três catalisadores que devem estar presentes nas melhores empresas de software para maximizar o valor da inteligência artificial no desenvolvimento de software.

O que distingue as empresas de software que mais avançaram na adoção da IA?

Sobre a pesquisa

Nossa metodologia de pesquisa abrangeu cinco dimensões fundamentais do modelo operacional dos produtos: estrutura, estratégia e governança, modos de trabalhar, cultura e talentos, e ferramentas. Perguntamos a quase 300 líderes de empresas de capital aberto sobre sua adoção e práticas de IA, e 100 deles avaliaram o impacto e o desempenho da AI em quatro áreas: qualidade do software, time-to-market, produtividade da equipe e experiência do cliente. Definiu-se que as empresas de melhor desempenho são aquelas no quintil superior dessas quatro áreas e as de pior desempenho aquelas que estão no quintil inferior. Os três quintis intermediários definem empresas de desempenho médio. Os entrevistados representam inúmeros setores (incluindo tecnologia, serviços financeiros, saúde, energia e varejo) e regiões geográficas (Américas, Ásia e Europa), assegurando assim uma visão abrangente de como as organizações estão integrando a IA ao desenvolvimento de produtos.

Empresas que integram ativamente uma adoção madura da inteligência artificial ao desenvolvimento de software estão colhendo resultados expressivos: seu desempenho é 15 pontos percentuais superior ao das organizações de pior desempenho. Seu bom desempenho é caracterizado por maior consistência, pela qualidade dos artefatos, ciclos de sprint mais curtos, equipes mais enxutas e índices elevados de satisfação do cliente. Para entender o que sustenta esse desempenho superior, examinamos em detalhe os modelos operacionais desse grupo. E identificamos duas mudanças importantes, apoiadas por três catalisadores críticos, que distinguem essas empresas. Três desses cinco fatores estão presentes em quase dois terços delas, o que acontece em apenas 10% das empresas de pior desempenho (Quadro).

Juntos, esses cinco elementos mostram que a simples adoção de ferramentas de IA não é suficiente. As empresas precisam repensar a estrutura de suas equipes e o modo como desenvolvem software em um mundo movido pela IA.

Duas mudanças fundamentais para liberar o pleno potencial da IA no desenvolvimento de software

As empresas de melhor desempenho no desenvolvimento de software orientado por IA preenchem a lacuna entre experimentação e impacto ao incorporarem duas práticas que se reforçam mutuamente ao logo de todo o ciclo de vida do desenvolvimento de um produto (PDLC, product development life cycle).

1. Priorizar implementações de casos de uso de ponta a ponta ao longo de todo o PDLC

As empresas de melhor desempenho têm uma abordagem holística, incorporando a IA a todo o ciclo de vida de desenvolvimento, em vez de se limitarem a casos de uso isolados. Elas são seis a sete vezes mais propensas que seus pares a escalar a adoção de IA para quatro ou mais casos de uso – desde desenho e codificação até testes, implantação e monitoramento da adoção. Quase dois terços dessas empresas líderes relatam quatro ou mais casos de uso em escala – enquanto apenas 10% das empresas de pior desempenho podem dizer o mesmo.

A Cursor, startup de rápido crescimento nativa em IA, adotou essa abordagem abrangente. Na prática, sua equipe funciona como um laboratório interno dos fluxos de trabalho de engenharia, utilizando ferramentas de IA para testar soluções para seus desafios e “produtificar” aquelas que ganharem força. Os desenvolvedores combinam agentes de IA, suporte do Bugbot¹ e revisão humana para ampliar o escopo das tarefas de um software com o mínimo de disrupção, e equilibrar novas funcionalidades e melhorias no processo por meio de sprints. Os engenheiros da Cursor customizam comandos, instruções e regras de escopo variável para a equipe, seja para um único arquivo ou para toda a base de código, ajustando-os às preferências individuais de seus integrantes e às prioridades de desenho da organização. Com isso, puderam abandonar métodos ultrapassados de documentação esparsa e avançar para um processo robusto, orientado e contínuo de desenvolvimento que cobre todo o ciclo de vida dos produtos. A equipe utiliza o que chama de “Modo de Planejamento” de sua principal ferramenta de codificação para mapear modificações antes de implementá-las. Assim, pode iniciar o trabalho no editor a partir das solicitações de funcionalidades feitas pelos clientes ou diretamente com suas ferramentas próprias de comunicação.

Durante o desenvolvimento, os engenheiros colaboram com agentes em tempo real, inclusive por voz, para refatorar o código, fazer perguntas sobre sua base de código e criar novas funcionalidades. Ao mesmo tempo, eles acionam agentes em segundo plano para lidar com outras tarefas – às vezes executando vários agentes locais em paralelo na mesma tarefa e, posteriormente, avaliando os melhores resultados diretamente no editor. Essa configuração permite que a equipe alterne facilmente entre seu trabalho atual e as tarefas que delegaram ao agente em segundo plano, muitas vezes continuando a partir do ponto em que o agente parou. Para desenho e teste iterativos, os engenheiros controlam e exibem um navegador da web em seu editor para visualizar alterações durante o desenvolvimento, o que lhes possibilita auditar a acessibilidade, converter desenhos em código e fornecer feedback visual durante a depuração. O Bugbot, ferramenta de IA da Cursor para revisão de código, analisa o código resultante antes de encaminhá-lo para outros desenvolvedores da equipe para uma verificação final, acrescentando uma camada extra de validação a todo software em pré-produção. Esse novo fluxo do trabalho de desenvolvimento permitiu que a Cursor acelerasse a criação de funcionalidades com uma equipe enxuta.²

2. Criar funções nativas em IA ao longo do PDLC

Mais insights da McKinsey em português

Confira nossa coleção de artigos em português e assine nossa newsletter mensal em português.

Navegue pela coleção

A IA está, cada vez mais, assumindo tarefas fundamentais de engenharia, como refatoração, modernização e teste, marcando uma evolução inequívoca: de auxílios assistivos de codificação para colaboradores totalmente integrados que se expandem por todo o PDLC. Mais de 90% de todas as equipes de software que pesquisamos utilizam a IA para essas atividades, economizando em média seis horas por semana. No entanto, à medida que o crescimento do número de engenheiros desacelera, espera-se que os desenvolvedores combinem fluência técnica com um conhecimento profundo dos produtos, desenhos e negócios. Isso se torna possível graças a ferramentas mais poderosas, com melhor orquestração, como a transição do autocompletar básico para agentes guiados por raciocínio que planejam tarefas com base em mais informações contextuais. Por exemplo, ferramentas como GitHub Copilot, Claude Code e o agente Jules do Google, entre outras, evoluíram de simples complementos inline para a execução autônoma de tarefas de refatoração e modernização de múltiplos arquivos de longa duração.

Como parte dessa evolução, funções essenciais estão assumindo novas responsabilidades nativas em IA. Gerentes de produtos, por exemplo, hoje dedicam menos tempo à entrega de funcionalidades e mais ao desenho, prototipagem, garantia de qualidade e práticas responsáveis de implementação da IA. Por sua vez, os engenheiros de software se concentram mais em aumentar sua fluência em todo o stack, aprimorar a comunicação estruturada de especificações e aprofundar seu entendimento de trade-offs envolvendo arquitetura e sistemas. Ambas as funções agora exigem a aquisição de novas competências específicas de IA que complementem suas qualidades tradicionais – novas habilidades em áreas como escalabilidade, segurança e testes para desenvolvedores, estratégia, insights sobre clientes e governança (no caso dos gerentes de produtos). Olhando para o futuro, é possível que muitas equipes venham a atuar como orquestradoras de agentes de IA assíncronos e paralelos, agindo em conjunto para coordenar fluxos de trabalho, definir a lógica de ponta a ponta e monitorar continuamente os resultados. Cada vez mais, as empresas criarão softwares customizados sob demanda (por exemplo, ferramentas internas geradas pelo usuário), fazendo com que a definição de problemas e a especificação de intenções se tornem habilidades cada vez mais críticas e direcionando as organizações para modelos mais voltados a produtos.

A estrutura da equipe da Cursor reflete como as funções nativas em IA exigem novas habilidades ao longo de todo o PDLC. As fronteiras tradicionais entre front-end, back-end e controle de qualidade se fundiram num conjunto mais amplo de responsabilidades. Cada lançamento tem uma pessoa responsável específica, que coordena o desenvolvimento, os testes e a eliminação de bugs. Os gerentes de produtos testam funcionalidades internamente, os designers criam protótipos diretamente em código e as equipes de negócios e dados utilizam a plataforma para consultar dados do produto. Pequenas células ágeis [pods] atuam no âmbito de machine learning, infraestrutura e produtos, e seus projetos geralmente abrangem várias equipes. “Na próxima década, a programação assistida por IA permitirá que os desenvolvedores especifiquem a intenção por meio de uma combinação de linguagens de programação formais e linguagem natural, liberando-os para se concentrarem no desenho da lógica de seu software”, afirma Michael Truell, CEO e cofundador da Cursor. “Alguns colaboradores poderão atuar parte do tempo como gerentes de engenharia, dirigindo uma equipe ‘júnior’ de agentes assíncronos – será um novo tipo de trabalho que talvez exija um conjunto de habilidades totalmente novo. A IA provavelmente desempenhará um papel na revisão e nos testes de código, e a validação será acelerada em várias ordens de magnitude.”

Três catalisadores críticos do sucesso

Por mais essenciais que sejam, mudanças nessas duas práticas, por si só, não são suficientes para capturar todo o valor da IA no desenvolvimento de produtos de software. As empresas de melhor desempenho reforçam essas mudanças com três catalisadores críticos do desempenho – requalificação, mensuração de impacto e gestão de mudanças – que garantem que a adoção se traduza em ganhos de desempenho sustentáveis.

1. Requalificação: investir em treinamento personalizado e intensivo

Embora a maioria das empresas hoje ofereça cursos sob demanda, aquelas que investem em workshops práticos e mentoria individual têm muito mais chances de obter ganhos mensuráveis: 57% das organizações de melhor desempenho fazem esse tipo de investimento contra apenas 20% das de pior desempenho. Requalificar engenheiros e gerentes de produto para trabalharem com IA não é tão simples quanto apenas lhes fornecer uma ferramenta. A capacidade de decompor problemas de modo a possibilitar uma comunicação precisa com um grande modelo de linguagem (LLM) – isto é, dominar a engenharia de prompts – é apenas um exemplo da complexidade que exige treinamento intensivo para elevar o nível profissional dos indivíduos.

Organizações de alto desempenho desenham treinamentos que espelhem o trabalho real de desenvolvimento – integrando a IA nas revisões de código, nos sprints de planejamento e nos ciclos de teste – para que as equipes aprendam a aplicar IA em contextos reais, não em simulações. Também personalizam o tipo de aprendizado conforme a função; por exemplo, concentrando os desenvolvedores no desenho de prompts e na avaliação de modelos, e ajudando os gerentes de produto a aprender sobre comportamento de modelos, governança de dados e uso responsável da IA.

Como as ferramentas estão avançando rapidamente, o treinamento tem de ser um exercício contínuo. Documentação estática ou sessões anuais logo perdem a relevância. O treinamento contínuo e contextual, incorporado a rituais como retrospectivas, tornou-se um diferencial fundamental. Algumas empresas líderes até estabeleceram “consórcios de IA” internos ou “centros de capacitação” que selecionam novos casos de uso, compartilham as melhores práticas e atuam como mentores sob demanda para as equipes de um projeto.

Em última instância, a produtividade depende tanto da mentalidade e da colaboração como das ferramentas e tecnologias em si. As equipes que tornam o aprendizado parte do seu trabalho – tratando cada sprint como uma oportunidade para experimentar e aprimorar – são as que conseguirão traduzir a adoção da IA em impacto mensurável nos negócios.

2. Mensuração de impacto: monitorar os resultados, não só a adoção

Organizações de alto desempenho sabem que não basta focar apenas as métricas de adoção, como frequência de utilização das ferramentas ou taxas de aceitação de código, mas também monitorar os resultados, como melhorias na qualidade (79%) e ganhos de rapidez (57%). Por responsabilizarem as equipes pelo impacto, essas organizações mantêm o momentum e se ajustam rapidamente quando necessário, enquanto empresas de baixo desempenho se concentram apenas nas métricas de adoção – que, por si só, têm pouca correlação com o desempenho. À medida que as ferramentas evoluem e passam a incluir mais funcionalidades (como gerar código a partir de um documento de desenho), as melhores métricas de impacto também evoluirão, forçando as organizações a serem flexíveis e adaptáveis. “Com demasiada frequência, as empresas medem o impacto da IA computando o volume de código que ela produz, não o que esse código é capaz de realizar”, afirma Tariq Shaukat, CEO da Sonar, empresa de ferramentas e soluções para análise da qualidade de código. “Linhas de código ou percentuais de contribuição da IA não revelam se o resultado é seguro, de fácil manutenção ou mesmo útil. O verdadeiro progresso vem de monitorar como essas ferramentas ajudam as equipes a entregar softwares mais confiáveis e de melhor qualidade, e não apenas em mais quantidade.”

Medindo corretamente o impacto da IA. Três medidas ajudarão a construir um sistema robusto de mensuração:

Selecionar métricas relevantes. Defina os resultados mais importantes, como ciclos de desenvolvimento mais rápidos, lançamentos de melhor qualidade e maior satisfação do cliente. Evite indicadores ineficazes, como a porcentagem de código gerado por IA, que oferecem poucas informações sobre a verdadeira produtividade. Sobreponha métricas de resultado (como produtividade, velocidade e qualidade) às métricas de entrada (como adoção de recursos de IA ou detecção de defeitos) a fim de normalizar o impacto do progresso ao longo do tempo.
Instituir um monitoramento integrado. Conecte dados referentes a ferramentas de planejamento, repositórios de código e registros de utilização da IA para criar uma visão mais completa do desempenho. O monitoramento integrado ajuda a identificar gargalos no ciclo de vida do desenvolvimento e garante que as equipes estejam progredindo em direção aos resultados de negócios desejados.
Comunique os insights regularmente. Transmita constantemente as informações obtidas para os líderes de produtos, engenharia e negócios. Relatórios regulares identificarão os sucessos alcançados, sinalizarão antecipadamente novos problemas e permitirão coordenar correções de rumo.

3. Gestão de mudanças: alinhar incentivos com comportamentos habilitados por IA que impulsionam o impacto

Empresas de alto desempenho incorporam a adoção da IA diretamente às avaliações de desempenho. Quase oito em cada dez vinculam metas relacionadas à IA generativa às avaliações dos gerentes de produto e desenvolvedores, algo que apenas 10% das empresas de pior desempenho fazem no caso de desenvolvedores e nenhuma o faz para gerentes de produto. Ao alinhar objetivos individuais com a estratégia de IA da organização, essas empresas criam um forte senso de responsabilização e incentivam os funcionários a integrar a IA aos seus fluxos de trabalho do dia a dia.

As organizações líderes concentram seus incentivos nos comportamentos que geram mais impacto, não apenas na utilização da IA. As metas são definidas em torno das contribuições individuais, como identificar oportunidades de automação, acelerar processos por meio de testes assistidos por IA ou aprimorar a qualidade mediante revisão de código orientada por modelos. Essas métricas comportamentais formam a base para o impacto real, evitando ao mesmo tempo a armadilha de avaliar os indivíduos por resultados que eles não têm como controlar totalmente.

As empresas de alto desempenho também esperam que as equipes conectem seu trabalho habilitado por IA a resultados mais amplos, como melhorias de produtividade, qualidade ou experiência do cliente. Isso torna as pessoas mais conscientes do impacto da IA sem vincular sua remuneração a métricas fora da sua área de influência. Incorporar essas expectativas aos sistemas de desempenho leva a empresa para além de exigências pontuais e torna a adoção de IA uma competência organizacional permanente que sempre impulsionará a inovação e o valor mensurável.

Rumo ao verdadeiro valor criado pela IA

Nos últimos anos, muitas empresas aprenderam em primeira mão que gerar impacto financeiro real incorporando a IA ao desenvolvimento de produtos de software exige mudanças radicais no modelo operacional e a adoção de novas práticas e ferramentas cruciais. Essa flexibilidade e a capacidade de adaptação são fundamentais, dada a rapidez com que o ecossistema de codificação por IA está evoluindo. Novas ferramentas surgem a cada poucos meses e a inteligência dos modelos avança sem parar. Somente no último ano, o benchmark de codificação de IA Artificial Analysis³ quase dobrou – de 30 para 55 pontos –, embora ainda esteja 20 pontos abaixo do índice geral de inteligência de todos os modelos, o que indica que as ferramentas de IA para codificação ainda têm espaço para se tornarem mais inteligentes.⁴

No entanto, a inteligência bruta é apenas parte da história. As ferramentas estão se tornando mais poderosas à medida que se expandem por todo o ciclo de vida do desenvolvimento de produtos (PDLC). Com orquestração mais robusta e integração de sistemas mais estreita, estão deixando de ser simples ferramentas de autocompletar e evoluindo para se tornar agentes híbridos guiados por raciocínio e capazes de planejar tarefas, chamar ferramentas externas e até mesmo simular automaticamente testes de usuários utilizando um navegador no computador, tudo isso com o suporte de um contexto mais aprofundado.

Organizações que buscam acompanhar o ritmo desses avanços também precisam repensar desde já as estruturas e práticas necessárias para maximizar seu impacto, pois a implementação de mudanças organizacionais sustentáveis não ocorre da noite para o dia – mesmo com as ferramentas de IA evoluindo em ritmo vertiginoso. As empresas de software na vanguarda do uso da IA para gerar impacto real adotam iniciativas ousadas e abrangentes, e tratam a IA como um catalisador capaz de transformar todo o processo de desenvolvimento. Além das práticas e dos catalisadores que descrevemos neste artigo, empresas de alto desempenho costumam seguir três etapas principais para potencializar a produtividade: definir metas ambiciosas que alinham a liderança e energizam a organização; desenvolver um plano holístico para o futuro modelo operacional, testado e ajustado ao contexto específico da organização; e criar um roadmap detalhado que redefine a estrutura das equipes, os fluxos de trabalho, as métricas e os incentivos. Somente uma abordagem estratégica e integral da inteligência artificial permitirá que as equipes de software capturem todo o potencial dessa tecnologia como uma força de inovação, eficiência e criação de valor no desenvolvimento de software.