Repensando a IA generativa: o que precisa mudar para transformar potencial em valor em 2024

Observação: Nós nos empenhamos ao máximo para manter o espírito e as nuances originais de nossos artigos. Porém, pedimos desculpas desde já por quaisquer erros de tradução que você venha a notar. Seu feedback é bem-vindo através do e-mail reader_input@mckinsey.com

Chegou a hora de dar um reset na IA generativa (genAI). O entusiasmo inicial e a febre de atividades de 2023 estão cedendo lugar a dúvidas e recalibragens à medida que as empresas vão se dando conta de que capturar o enorme valor potencial da genAI é mais difícil do que se esperava.

Tudo indica que 2024 será o ano em que a genAI provará seu valor, mas as empresas devem ter em mente as duras lições que aprenderam com as transformações digitais e com outros tipos de inteligência artificial: a vantagem competitiva vem da construção de capacidades organizacionais e tecnológicas para continuamente inovar, implantar e melhorar soluções em escala – ou seja, vem de uma ampla reconfiguração da empresa que permita disseminar inovações digitais e de IA.

Sobre a QuantumBlack, AI by McKinsey

A QuantumBlack, o braço de inteligência artificial da McKinsey, contribui para a transformação de empresas através do poder da tecnologia, da expertise técnica e de especialistas da área. Ao lado de milhares de profissionais da QuantumBlack (engenheiros e cientistas de dados, gerentes de produto, projetistas e engenheiros de software) e da McKinsey (peritos em áreas e setores específicos), estamos trabalhando em todo o mundo para resolver os grandes desafios da inteligência artificial. O QuantumBlack Labs é nosso centro de desenvolvimento tecnológico e inovação para clientes, que tem promovido o avanço e o desenvolvimento de ponta da inteligência artificial ao redor do globo.

Empresas que quiserem colher os benefícios da genAI desde já precisam agir com rapidez. No entanto, se estiverem esperando que a IA generativa lhes ofereça um atalho para evitarem uma difícil – e necessária – cirurgia organizacional, provavelmente ficarão decepcionadas com os resultados. Lançar pilotos é (relativamente) fácil; escalar esses pilotos e criar valor significativo é bem mais difícil, pois exige um vasto conjunto de mudanças no modo como o trabalho é efetivamente realizado.

Vejamos brevemente o que isso significou para uma empresa de telecomunicações da região do Pacífico. A empresa contratou um diretor de dados e de IA cuja missão era “capacitar a organização a criar valor com dados e inteligência artificial”. Esse profissional trabalhou com a alta gestão na elaboração de uma visão estratégica e na implementação de um roadmap para casos de uso. Após analisarem alguns domínios (as jornadas do cliente e as funções ligadas ao cliente) e as oportunidades de casos de uso em toda a empresa, os líderes decidiram priorizar o domínio de “serviços e manutenção em domicílio” para criarem um programa piloto, que seria subsequentemente ampliado através de uma sequência maior de iniciativas. A tarefa principal foi desenvolver uma ferramenta de genAI que ajudasse os coordenadores e operadores de serviços a prever melhor os tipos de solicitações de clientes e as peças necessárias para efetuarem manutenção em suas residências.

A liderança criou equipes multifuncionais de produto, com objetivos e incentivos compartilhados, para construir essa ferramenta de IA generativa. Como parte de um grande esforço para requalificar todos na empresa para que trabalhassem melhor com dados e ferramentas de genAI, também foi criada uma academia de dados e IA, na qual os coordenadores e operadores de serviços se inscreveram como parte de seu treinamento. Visando assegurar o devido esteio tecnológico e de dados para a genAI, o diretor de dados e de IA também selecionou um grande modelo de linguagem (LLM) e um provedor na nuvem capaz de atender às necessidades do domínio e servir a outras áreas da empresa. Além disso, o diretor supervisionou a implementação de uma arquitetura de dados para que dados limpos e confiáveis (incluindo históricos de atendimento e bancos de dados de estoque) – imprescindíveis para construir a ferramenta de genAI – pudessem ser acessados de forma rápida e responsável.

Mais insights da McKinsey em português

Confira nossa coleção de artigos em português e assine nossa newsletter mensal em português.

Navegue pela coleção

Nosso livro Rewired: The McKinsey guide to outcompeting in the age of digital and AI (Wiley, junho de 2023) é um manual detalhado das seis capacidades necessárias para se promover o tipo de mudança geral que permitirá aproveitar a tecnologia digital e a inteligência artificial. Neste artigo, examinaremos como estender cada uma dessas capacidades para implementar em escala um programa bem-sucedido de genAI. Reconhecemos que ainda estamos nos primeiros dias dessa nova era e que há muito mais para aprender, mas nossa experiência tem mostrado que, para se valerem das oportunidades da genAI, as empresas precisam reconfigurar das seguintes maneiras o modo como trabalham.

Determinar onde os copilotos de genAI podem criar uma vantagem competitiva real

O forte entusiasmo em torno da genAI e sua relativa facilidade de uso provocou um verdadeiro surto de experimentação nas organizações. Entretanto, a maioria dessas iniciativas não gerará vantagem competitiva. Certo banco, por exemplo, adquiriu dezenas de milhares de licenças do GitHub Copilot, mas como não tinha uma noção clara de como trabalhar com a tecnologia, o progresso foi lento. Outro esforço desordenado que vemos com frequência são as empresas que incorporam a genAI ao seu atendimento ao cliente. Na maioria dos casos, porém, o suporte ao cliente é uma commodity capability [isto é, uma função transacional ou de apoio], que não faz parte do negócio principal; portanto, ainda que a IA generativa possa contribuir para melhorar a produtividade, ela não criará uma vantagem competitiva.

Para criarem vantagem competitiva, as empresas devem primeiro compreender as diferenças entre três arquétipos de genAI: “tomar” (utilizar ferramentas disponíveis, muitas vezes através de APIs e serviços de assinatura), “amoldar” (integrar dados proprietários a modelos existentes) e “fazer” (construir LLMs). Por enquanto, a opção de fazer, isto é, de construir LLMs próprios, é cara demais para a maioria das empresas, de modo que, por ora, a solução ideal é implementar um modelo de tomar ferramentas já disponíveis para melhorar a produtividade e, ao mesmo tempo, ir construindo aplicações capazes de amoldar dados proprietários a modelos existentes para criar vantagem competitiva.

Grande parte do valor da IA generativa no curto prazo está intimamente ligado à sua capacidade de ajudar as pessoas a realizarem melhor seu trabalho atual. Ou seja, essas ferramentas de genAI agem como copilotos que atuam lado a lado com o funcionário, seja criando um bloco inicial de código que um desenvolvedor poderá adaptar, por exemplo, seja redigindo a requisição de uma nova peça que um funcionário de manutenção no campo poderá revisar e encaminhar (veja Box, “Exemplos de copilotos em três arquétipos de IA generativa”). Isso significa que os copilotos devem ser integrados às iniciativas prioritárias da empresa, onde o impacto dessa tecnologia será maior.

Exemplos de copilotos em três arquétipos de IA generativa

Copilotos que “tomam”. Podem ajudar os clientes do setor imobiliário a fazer uma triagem dos imóveis disponíveis para encontrarem as opções mais promissoras, escrever código de programação para uma incorporadora e resumir transcrições para investidores.
Copilotos que “amoldam”. Oferecem recomendações aos representantes de vendas sobre os melhores clientes conectando ferramentas de genAI a sistemas de gerenciamento da relação com clientes, a sistemas financeiros e a históricos de comportamento do cliente. Também podem criar assistentes virtuais para personalizar tratamentos a pacientes e recomendar soluções para funcionários de manutenção com base em dados históricos.
Copilotos que “fazem”. Incluem os modelos de fundação que os cientistas de laboratórios farmacêuticos utilizam para descobrir e testar mais rapidamente medicamentos novos e mais eficazes.

Para algumas empresas industriais, a manutenção é um domínio crítico. Uma revisão dos relatórios de manutenção e conversas com funcionários nas linhas de frente ajudam determinar como um copiloto de genAI poderia fazer uma grande diferença – por exemplo, identificando rápida ou preventivamente falhas de equipamento. Um copiloto de genAI também pode ajudar a identificar as causas-raiz de avarias em caminhões e recomendar soluções muito mais depressa do que o habitual. E pode ainda atuar como uma fonte contínua de práticas recomendadas ou procedimentos operacionais padrão.

No que diz respeito aos copilotos, o grande desafio é descobrir como gerar receitas a partir do aumento da produtividade. No caso das centrais de atendimento ao cliente, por exemplo, as empresas podem obter ganhos financeiros reais não contratando novos agentes e deixando o número de agentes ir diminuindo aos poucos. Elaborar antecipadamente planos para gerar receitas com o aumento da produtividade é, portanto, crucial para capturar o valor.

Requalificar os talentos existentes, deixando claro quais são as habilidades de genAI de que a empresa precisa

Hoje a maioria das empresas possui conhecimento razoável das habilidades técnicas de genAI de que precisam: ajuste fino de modelos, gerenciamento de bancos de dados vetoriais, engenharia de prompts e engenharia de contextos, entre outras. Em muitos casos, são habilidades que os trabalhadores podem adquirir mediante treinamento, e os que já forem capacitados em inteligência artificial e machine learning terão uma grande vantagem. Engenheiros de dados, por exemplo, podem aprender processamento multimodal e gerenciamento de bancos de dados vetoriais, engenheiros de MLOps (operações de machine learning) podem estender sua vocação para LLMOps (operações de LLMs) e cientistas de dados podem se especializar em engenharia de prompts, detecção de vieses e ajuste fino de modelos.

Exemplos de novas habilidades exigidas pela genAI

Veja abaixo alguns exemplos de novas competências necessárias para implementar com sucesso ferramentas de IA generativa:

cientista de dados:

engenharia de prompts
aprendizagem contextual
detecção de vieses
identificação de padrões
aprendizagem por reforço com feedback humano
ajuste fino de LLMs e de hiperparâmetros; aprendizagem por transferência

engenheiro de dados:

preparação de dados (data wrangling) e armazenamento de dados
construção de pipelines de dados
processamento multimodal
gerenciamento de banco de dados vetoriais

Até que se atinja um nível razoável de competência, o processo de aprendizagem pode levar dois a três meses, devido às complexidades de entender o que os vários LLMs podem ou não fazer e qual o melhor modo de utilizá-los. Os programadores precisam adquirir experiência em construção de software, realização de testes e validação de respostas, por exemplo. Uma empresa de serviços financeiros levou três meses treinando seus melhores cientistas de dados para que adquirissem um nível de competência elevado. Embora existam cursos e documentação disponíveis – muitos provedores de LLMs oferecem programas de treinamento intensivo para desenvolvedores – verificamos que as maneiras mais eficazes de desenvolver capacidades em escala são “formar aprendizes”, treinar pessoas para treinar outras pessoas e construir comunidades de profissionais qualificados. Algumas práticas bem-sucedidas de construção de tais comunidades são o rodízio de especialistas entre equipes para treinar outros, sessões regulares para as pessoas compartilharem aprendizados e a organização de sessões quinzenais de revisão da documentação (veja Box “Exemplos de novas habilidades exigidas pela genAI”).

É importante ter em mente que as habilidades de genAI envolvem mais do que proficiência em programação ou codificação. Quando desenvolvemos nossa plataforma própria de genAI, a Lilli, a experiência nos mostrou que, no caso da IA generativa, os melhores talentos técnicos também possuem: habilidades de desenho para saber onde focar as soluções; compreensão contextual para garantir a geração de respostas relevantes e de alta qualidade; capacidade de colaborar e trabalhar bem com especialistas (para testar e validar respostas e desenvolver uma abordagem apropriada para selecioná-las); métodos para investigar e descobrir as causas das falhas (o problema são os dados, a interpretação da intenção do usuário, a qualidade dos metadados incorporados ou algum outro fator?); e uma certa antevisão que lhes permite conceber e planejar possíveis resultados, inserindo o tipo certo de monitoramento no código que criam. Um programador puro, isto é, que não possua intrinsecamente essas habilidades, talvez não será um membro muito útil da equipe.

Embora a requalificação profissional dependa, em grande parte, de “aprender no próprio trabalho”, temos visto a ampliação acelerada de um mercado para pessoas que adquiriram essas competências ao longo do ano passado. A aquisição de novas habilidades vem ocorrendo rapidamente. O GitHub informou que “um número enorme” de desenvolvedores estava trabalhando em projetos de genAI e que 65.000 projetos públicos de genAI foram criados em sua plataforma em 2023 – um salto de quase 250% em relação ao ano anterior. Para uma empresa que esteja começando agora sua jornada da IA generativa, uma boa medida seria contratar dois ou três engenheiros seniores “amoldadores”, isto é, que já tenham construído algum produto de genAI integrando dados proprietários a um modelo existente. Isso poderá acelerar muito seus esforços.

Formar uma equipe centralizada para definir padrões que permitam escalar responsavelmente

Para assegurar que todas as partes da empresa possam escalar as capacidades de genAI, a centralização das competências é um primeiro passo natural. O foco crítico dessa equipe central será desenvolver e implementar protocolos e padrões que permitam redimensionar adequadamente a iniciativa, garantindo que as demais equipes possam acessar modelos e, ao mesmo tempo, minimizar riscos e conter custos. O trabalho da equipe central deve incluir, por exemplo, a aquisição de modelos, a prescrição dos modos de acessá-los, a elaboração de padrões para a prontidão de dados, a criação de bibliotecas de prompts aceitáveis e a alocação de recursos.

Ao desenvolvermos a Lilli, nossa equipe já pensava em termos de escala quando criamos arquitetura de plug-in aberta e definimos padrões de construção e funcionamento de APIs. Desenvolvemos ferramentas e infraestrutura padronizadas que permitiram que outras equipes experimentassem e acessassem com segurança um GPT LLM [isto é, um transformador generativo pré-treinado de grandes modelos de linguagem], um gateway com APIs de acesso pré-aprovado e um portal para autoatendimento de desenvolvedores. Nosso objetivo é que, ao longo do tempo, essa abordagem possa transformar a “Lilli como produto” (que algumas poucas equipes utilizam para construir soluções específicas) em “Lilli como plataforma” (que todas as equipes de uma empresa possam acessar para construir outros produtos).

Para equipes que desenvolvem soluções de genAI, a composição de um squad [time multidisciplinar] será semelhante à dos times de IA, mas incluirá também engenheiros e cientistas de dados com experiência em genAI, gerentes de riscos, profissionais de compliance e elementos do departamento jurídico. A ideia de formar squads com profissionais de diferentes áreas de expertise permanece; o que muda é a composição das habilidades de um squad dedicado especificamente à genAI.

Configurar a arquitetura de tecnologia para que seja escalável

Construir um modelo de IA generativa não costuma ser problemático, mas torná-lo plenamente operacional em escala é uma outra questão totalmente diferente. Já vimos engenheiros construírem um chatbot básico em uma semana, mas o lançamento de uma versão estável, precisa, compatível e escalável pode levar quatro meses. É por isso que, em nossa experiência, o custo do modelo pode ser menos de 10% a 15% do custo total da solução.

Construir algo escalável não significa construir uma nova arquitetura de tecnologia, mas sim focar algumas decisões chave que simplificarão e acelerarão os processos sem gastos excessivos. Três dessas decisões se destacam:

Focar a reutilização da tecnologia. O reaproveitamento de códigos pode aumentar em 30% a 50% a velocidade de desenvolver casos de uso de genAI. Uma boa abordagem é simplesmente criar uma fonte de ferramentas, códigos e componentes pré-aprovados. Certa empresa de serviços financeiros criou uma biblioteca de ferramentas prontas para uso pré-aprovadas pelo pessoal de segurança e pelo departamento jurídico, e disponibilizou-as para as equipes. O mais importante aqui é dedicar tempo suficiente para identificar e desenvolver as capacidades que sejam comuns aos casos de uso prioritários. Essa mesma empresa de serviços financeiros, por exemplo, identificou três componentes que poderiam ser reutilizados em mais de 100 casos de uso. E como construiu primeiro esses componentes, a empresa conseguiu gerar uma parcela significativa da base do código para todos os demais casos de uso identificados – essencialmente dando a cada aplicação uma grande vantagem inicial.
Criar uma arquitetura que permita conexões eficientes entre os modelos de genAI e os sistemas internos. Para que os modelos de genAI sejam eficazes no arquétipo de “amoldar” [integrar dados proprietários a modelos existentes], é preciso que tenham acesso aos dados e aplicações da empresa. Os avanços nas estruturas de integração e orquestração reduziram significativamente o esforço necessário para fazer essas conexões. Mas é fundamental definir o que são essas integrações e como habilitá-las para garantir que tais modelos sejam eficientes e para evitar as complexidades que acabam criando a chamada “dívida técnica” (o “imposto” que uma empresa paga em tempo e recursos para resolver problemas tecnológicos existentes). Os diretores de informação e de tecnologia devem definir para suas organizações quais são as arquiteturas e os padrões de integração de referência. Alguns elementos chave são: um hub de modelos (contendo modelos treinados e aprovados que possam ser aprovisionados sob demanda); APIs padrão que atuem como pontes entre os modelos de genAI e os dados ou aplicações; e o gerenciamento e o cache de contextos, que aceleram o processamento fornecendo modelos com informações relevantes das fontes de dados corporativos.
Consolidar as capacidades de testar e de garantir a qualidade. Nossa experiência na construção da Lilli nos ensinou a priorizar os testes, não o desenvolvimento. Nossa equipe não só elaborou protocolos de testes para cada etapa do desenvolvimento, mas também buscou alinhar-se para deixar bem claro quem deveria aprovar cada uma dessas etapas, por exemplo. Isso retardou o desenvolvimento inicial, mas acelerou o ritmo e a qualidade geral da entrega, pois reduziu o número de erros e o tempo necessário para corrigi-los.

Garantir a qualidade dos dados e focar os dados não estruturados para alimentar os modelos

A capacidade de gerar e escalar valor a partir dos modelos de genAI dependerá do modo como a empresa faz uso de seus próprios dados. Assim como acontece com a tecnologia, é preciso realizar atualizações direcionadas da arquitetura de dados existente para maximizar os benefícios estratégicos futuros da IA generativa:

Empenhar-se em melhorar a qualidade dos dados e em ampliar os esforços para aumentá-los.¹ Embora a qualidade dos dados sempre tenha sido uma questão essencial, a escala e o escopo dos dados (especialmente dos dados não estruturados) que os modelos de genAI são capazes de utilizar tornaram-na ainda mais importante. Por esse motivo, é crítico acertar os fundamentos dos dados – o que exige desde esclarecer os direitos de decisão até definir processos de dados claros e estabelecer taxonomias para que os modelos possam acessar os dados de que precisam. Empresas que fazem isso bem vinculam seus esforços para melhorar a qualidade dos dados e para aumentá-los a alguma aplicação e caso de uso específico de IA/genAI (não é preciso que esses fundamentos dos dados se estendam a todos os cantos da empresa). Isso pode implicar, por exemplo, a criação de um novo repositório de dados para todas as especificações de equipamentos e problemas relatados a fim de fortalecer o suporte aos copilotos de manutenção.
Saber qual é o valor latente dos dados não estruturados. Tradicionalmente, a maioria das organizações sempre concentrou suas iniciativas nessa área em dados estruturados (valores que podem ser organizados em tabelas, como preços e características), mas o valor real dos LLMs está em sua capacidade de trabalhar com dados não estruturados (por exemplo, slides do PowerPoint, vídeos e texto). As empresas podem mapear quais fontes de dados não estruturados são mais valiosas e estabelecer padrões de marcação (tagging) de metadados para que os modelos saibam processar os dados e as equipes consigam encontrar o que precisam (a marcação é particularmente importante para ajudar as empresas a remover dados dos modelos, se necessário). É preciso ser criativo quando se pensa nas oportunidades que os dados representam. Algumas empresas, por exemplo, estão entrevistando funcionários que se aposentam e alimentando um LLM com esse conhecimento institucional capturado para melhorar o desempenho de seu copiloto.
Otimizar para reduzir custos em escala. Muitas vezes, uma empresa chega a pagar 10 vezes mais por dados do que pagaria se otimizasse sua infraestrutura de dados e os custos subjacentes. Essa situação geralmente ocorre quando a empresa escala suas provas de conceito sem otimizar a abordagem de dados. Dois custos costumam se destacar. Primeiro, o custo de armazenamento, quando a empresa faz o upload de terabytes de dados para a nuvem e quer esses dados estejam disponíveis 24 horas por dia, 7 dias por semana. Na prática, porém, uma empresa raramente precisa de mais de 10% dos seus dados com esse nível de disponibilidade, e acessar o restante em 24 ou 48 horas é uma opção muito mais em conta. Segundo, os custos envolvidos na computação com modelos que, para funcionarem, exigem acesso imediato a milhares de processadores. Isso ocorre especialmente quando a empresa está construindo um modelo próprio (o arquétipo de “fazer”), mas também quando utiliza modelos pré-treinados com dados e casos de uso próprios (o arquétipo de “amoldar”). As empresas devem prestar mais atenção à otimização dos custos de computação em plataformas na nuvem. Uma opção muito mais econômica seria colocar alguns modelos em uma fila, para só serem executados quando os processadores não estiverem sendo usados (por exemplo, quando os americanos vão dormir e o consumo de serviços computacionais como o Netflix diminui).

Criar confiança e promover a reutilização para impulsionar a adoção e a escala

Como muitas pessoas têm preocupações em relação à IA generativa, a importância de explicar como essas ferramentas funcionam é muito maior do que no caso da maioria das soluções. As pessoas que utilizam essas ferramentas querem saber como elas funcionam, não apenas o que fazem. Portanto, é fundamental investir mais tempo e dinheiro para criar confiança. E, para isso, é necessário garantir a precisão do modelo e facilitar a verificação das respostas.

Uma seguradora, por exemplo, criou uma ferramenta de genAI para ajudar a gerenciar sinistros. A ferramenta inclui uma lista de todas as métricas de proteção que haviam sido implementadas, sendo que cada resposta era acompanhada de link para a frase ou página do documento normativo pertinente. A empresa também utilizou um LLM para gerar inúmeras variações da mesma pergunta para assegurar a consistência das respostas. Essas medidas, entre outras, foram essenciais para ajudar os usuários finais a terem confiança na ferramenta.

Parte do treinamento das equipes de manutenção que utilizam uma ferramenta de genAI deve ser ajudá-las a entender as limitações dos modelos e a melhor maneira de obterem as respostas certas. Isso inclui ensinar aos trabalhadores estratégias para se obter a melhor resposta o mais rápido possível, começando com perguntas mais genéricas e restringindo-as progressivamente. Esse esquema proporciona mais contexto ao modelo e também ajuda a eliminar qualquer viés de pessoas que talvez julguem já saber a resposta. E se os modelos tiverem interfaces similares às das ferramentas existentes, os usuários se sentirão menos pressionados a aprender algo novo cada vez que uma nova aplicação for introduzida.

Atingir a escala almejada significa que a empresa precisa parar de criar soluções para um ou outro caso de uso específico, pois tais soluções são difíceis de aplicar em outros casos de uso similares. Por exemplo, certa empresa global de energia e materiais definiu a facilidade de reutilização como um requisito fundamental para todos os modelos de genAI e constatou logo nas primeiras iterações que 50% a 60% dos componentes poderiam ser reaproveitados. Para tanto, é preciso estabelecer padrões para o desenvolvimento de ativos de genAI (por exemplo, prompts e contexto) que permitam que eles sejam facilmente reutilizados em outros casos.

Embora muitas das questões sobre riscos envolvendo a IA generativa sejam evoluções de discussões que já vinham fermentando – privacidade de dados, segurança, risco de vieses, eliminação de empregos e proteção da propriedade intelectual, entre outras –, a genAI ampliou enormemente o âmbito de riscos. Apenas 21% das empresas que adotaram a genAI afirmam ter estabelecido políticas para reger como os funcionários utilizam as tecnologias de IA generativa.

Do mesmo modo, é preciso definir para as soluções de IA/genAI um conjunto de testes que demonstrem que a privacidade dos dados, a prevenção de vieses e a proteção da propriedade intelectual estão sendo respeitadas. Algumas organizações estão até mesmo propondo lançar modelos acompanhados de documentação que detalhe as características de seu desempenho. Documentar cada decisão tomada e o que as motivou pode ser particularmente útil quando se for conversar com os agentes regulatórios.

Sob alguns aspectos, este artigo é prematuro – tantas coisas estão mudando que é provável que daqui a um ano tenhamos uma compreensão profundamente diferente da IA generativa e de suas capacidades. Mas as verdades fundamentais sobre como encontrar valor e promover mudanças ainda se aplicarão. As empresas precisam aprender bem tais lições, pois é isso que determinará em grande parte se serão bem-sucedidas na captura desse valor.