Console de serviço mostrando uma janela de chat com o Einstein ajudando a responder perguntas

Como o Mecanismo de raciocínio Atlas alimenta o Agentforce

Agentes de IA autônomos e proativos estão na essência do Agentforce. Mas como eles funcionam? Vamos dar uma olhada mais aprofundada.

Shipra Gupta

A velocidade da inovação no mundo da IA e, especificamente, da IA generativa, continua em um ritmo vertiginoso. Com a sofisticação técnica atualmente disponível, o setor está evoluindo rapidamente da automação conversacional assistiva para a automação baseada em funções, que amplifica a força de trabalho. Para que a inteligência artificial (IA) mimetize um desempenho de nível humano, é vital entender o que torna os humanos mais eficazes na conclusão de trabalhos: ação. Os humanos são capazes de absorver dados, raciocinar sobre possíveis caminhos a seguir e agir. Equipar a IA com esse tipo de ação requer um nível extremamente alto de inteligência e tomada de decisão.

Na Salesforce, aproveitamos os últimos avanços em grandes modelos de linguagem (LLMs) e técnicas de raciocínio para lançar o Agentforce. O Agentforce é um conjunto de agentes de IA prontos para uso (isto é, apps autônomos e proativos projetados para executar tarefas especializadas) e um conjunto de ferramentas para criá-los e personalizá-los. Esses agentes de IA autônomos podem pensar, raciocinar, planejar e orquestrar com um alto nível de sofisticação. O Agentforce representa um salto quântico na automação de IA para atendimento ao cliente, vendas, marketing, comércio e muito mais.

Este artigo esclarece as inovações que culminaram no Mecanismo de raciocínio Atlas, o cérebro do Agentforce, que foi incubado na Pesquisa de IA da SalesforceAbre em uma nova janela e que orquestra ações de forma inteligente e autônoma para levar às empresas uma solução agêntica de nível corporativo.

Calcule seu ROI com o Agentforce

Descubra quanto tempo e dinheiro você pode economizar com uma equipe de agentes de IA trabalhando lado a lado com seus colaboradores e sua força de trabalho. Basta responder a quatro perguntas simples para descobrir o que é possível com o Agentforce.

A evolução do Einstein Copilot para o Agentforce

No início deste ano, lançamos o Einstein Copilot, que agora evoluiu para um Agente Agentforce voltado ao gerenciamento de relacionamento com clientes (CRM). O Einstein Copilot era um assistente de conversação alimentado por IA generativa que derivava sua inteligência de um mecanismo chamado raciocínio em Cadeia de pensamentoAbre em uma nova janela (CoT). Nesse mecanismo, o sistema de IA imita a tomada de decisão no estilo humano ao gerar um plano que contém uma sequência de etapas para atingir uma meta.

Com o raciocínio baseado em CoT, o Einstein Copilot poderia cocriar e trabalhar em conjunto no fluxo do trabalho. Isso tornou o Copilot bastante avançado em comparação aos bots tradicionais, mas ainda assim ele não conseguiu realmente imitar uma inteligência semelhante à humana. Ele gerava um plano que continha uma sequência de ações em resposta às tarefas e, em seguida, executava essas ações uma a uma. Se o plano estivesse incorreto, no entanto, ele não tinha como pedir um redirecionamento ao usuário. Isso resultou em uma experiência de IA que não era adaptável: os usuários não podiam fornecer informações novas e úteis à medida que a conversa progredia.

Ao submetermos o Einstein Copilot a testes rigorosos com milhares de vendedores de nossa própria organização de vendas (Org 62), surgiram alguns padrões:

  • A experiência de conversação em linguagem natural do Copilot foi muito melhor do que a dos bots tradicionais, como esperado, mas ainda não estava alcançando o Santo Graal de ser verdadeiramente semelhante à experiência de conversação humana. Ela precisava ser mais coloquial.
  • O Copilot fez um excelente trabalho cumprindo as metas do usuário com as ações com as quais foi configurado, mas não conseguiu lidar com perguntas complementares sobre informações que já existiam na conversa. Era necessário aproveitar melhor o contexto para responder a mais consultas de usuários.
  • À medida que adicionamos mais ações para automatizar mais casos de uso, o desempenho do Copilot começou a diminuir, tanto em termos de latência (quanto tempo ele demorava para responder) quanto em termos de qualidade da resposta. O Copilot precisava dimensionar de forma eficaz para milhares de casos de uso e apps que poderiam se beneficiar dele.

Estávamos determinados a encontrar uma solução para esses problemas, e isso levou ao nascimento do Agentforce.

Personagens do Agentblazer

Entre para a comunidade de Agentblazers.

Conecte-se com Agentblazers de todo o mundo para se especializar em IA, descobrir casos de uso, ouvir especialistas em produtos e muito mais. Aumente sua experiência em IA e desenvolva sua carreira.

Agentforce: um grande salto no raciocínio

O Agentforce é a solução de automação conversacional de nível corporativo focada no setor que é capaz de tomar decisões proativas e inteligentes em grande escala, com pouca ou nenhuma intervenção humana. Vários avanços tornam isso possível.

  • Orquestração baseada em prompts ReAcT versus CoT. Extensas experiências e testes mostraram que prompts no estilo Raciocinar e agir (ReACT) produziu resultados muito melhores em comparação com a técnica CoT. No mecanismo ReAct, o sistema passa pelo ciclo raciocinar, agir e observar até que a meta do usuário seja cumprida. Esse tipo de abordagem em ciclo permite que o sistema considere qualquer informação nova e faça perguntas esclarecedoras ou confirmações para que a meta do usuário seja cumprida com a maior precisão possível. Isso também leva a uma experiência de conversação muito mais fluida e natural, semelhante à linguagem.
  • Classificação de tópicos. Introduzimos um novo conceito chamado tópicos, que mapeia a intenção do usuário ou o trabalho a ser feito. Quando uma entrada do usuário chega, ela é mapeada para um tópico, que contém o conjunto relevante de instruções, políticas comerciais e ações para atender a essa solicitação. Esse mecanismo ajuda a definir o escopo da tarefa e o espaço de solução correspondente para o LLM, permitindo que o sistema dimensione sem esforço. As instruções em linguagem natural incorporadas nos tópicos fornecem orientação e proteções adicionais para o LLM. Então, se for necessário executar algumas ações em uma determinada sequência, essa pode ser uma instrução de tópico em linguagem natural. Se houver políticas comerciais como “devoluções gratuitas em até 30 dias”, elas podem ser especificadas como uma instrução e passadas ao LLM, para que ele possa levá-las em consideração e informar adequadamente a interação do usuário. Esses conceitos permitem que os agentes dimensionem para milhares de ações com segurança.
  • Use LLMs para respostas. Anteriormente, restringíamos o sistema a responder somente com saídas de ação, o que limitava severamente a capacidade deles de responder com base nas informações disponíveis na conversa. Ao abrir o sistema para permitir que o LLM responda usando o contexto do histórico da conversa, possibilitamos uma experiência de conversação muito mais rica. Agora, os usuários podem pedir esclarecimentos e fazer perguntas complementares às saídas anteriores, resultando num aumento geral da taxa de cumprimento de meta.
  • Pensamentos/raciocínio. Solicitar que os LLMs compartilhem ideias ou justifiquem a seleção de determinadas ações evita alucinações tremendamente. Isso tem a vantagem adicional de fornecer visibilidade sobre o comportamento do LLM, para que administradores e desenvolvedores possam ajustar o agente para que ele se alinhe às suas necessidades. O raciocínio está disponível na tela do Agent Builder por padrão, e os usuários também podem fazer ao agente perguntas complementares para que ele possa explicar seu raciocínio. Isso não apenas evita alucinações, mas ajuda a criar confiança.

Características adicionais do Agentforce

Além do Mecanismo de raciocínio Atlas, o Agentforce tem várias outras características notáveis que o diferenciam.

  • Ação proativa. As entradas do usuário são uma forma de acionar agentes. Mas os agentes do Agentforce também podem ser acionados por operações de dados em CRM ou processos e regras de negócios, como uma atualização do status do caso, um email recebido por uma marca ou uma reunião que começa em cinco minutos. Esses mecanismos oferecem aos agentes um nível de proatividade que os torna úteis e implantáveis em vários ambientes de negócios dinâmicos, expandindo a utilidade deles tanto para o front office quanto para o back office.
  • Recuperação dinâmica de informações. A maioria dos casos de uso de negócios envolve a recuperação de informações ou a execução de ações. Um dos mecanismos mais comuns para fornecer informações estáticas aos agentes é por meio da fundamentação. No entanto, é a capacidade dos agentes de acessar informações dinâmicas que libera um vasto potencial de casos de uso e apps.

    O Agentforce tem suporte a vários mecanismos de acesso a informações dinâmicas. O primeiro é a geração aumentada por recuperação, ou RAG. Ao usar a pesquisa semântica em dados estruturados e não estruturados no Data Cloud por meio do RAG, os agentes podem recuperar qualquer informação relevante de fontes de dados e bancos de dados externos.

    Em segundo lugar, com a introdução de ferramentas genéricas de recuperação de informações, como pesquisa na web e perguntas e respostas de conhecimento, aumentamos a capacidade do agente de lidar com tarefas complexas. Imagine pesquisar uma empresa ou um produto online usando a pesquisa na web, combinar isso com o conhecimento interno sobre as regras e políticas da empresa e, em seguida, realizar uma ação na forma de um resumo por e-mail para um contato. A combinação de dados de várias fontes permite que o agente gerencie as tarefas de negócios com muito mais efetividade e eficiência.

    Por fim, os agentes podem ser implantados em fluxos, APIs e classes do Apex. Dessa forma, todas as informações contextuais em um fluxo de trabalho, bem como as informações de vários cenários, podem ser passadas ao agente, evitando a necessidade de criar soluções personalizadas e tratar cada cenário separadamente. Todos esses mecanismos que permitem aos agentes acessar informações dinâmicas possibilitam que eles entendam melhor seu ambiente, o que multiplica a interatividade deles.
  • Transferência para agente humano. A IA não é determinística e pode ter alucinações. É por isso que fomos pioneiros na robusta Einstein Trust Layer para fornecer detecção de toxicidade, contratos de retenção zero de dados, defesa contra inserção de prompts e vários outros mecanismos. Inserimos regras em nossos prompts de sistema para evitar que os LLMs divaguem e tenham alucinações. Mas, apesar de todos esses mecanismos, os LLMs ainda não são 100% precisos. Para aqueles cenários de negócios críticos em que a tolerância a erros é zero, a transferência perfeita para um ser humano é fundamental, e é algo que o Agentforce oferece de forma nativa. O Agentforce trata a “transferência para agente humano” como mais uma ação, o que permite que uma conversa seja transferida de forma simples e segura para humanos em qualquer cenário de negócios desejado.

O que vem por aí no Agentforce

Apesar de estar no estágio inicial, o Agentforce é um divisor de águas para nossos clientes. Com o Agentforce Service Agent, os clientes como Wiley e Saks Fifth Avenue estão vendo um impacto exponencial nos seus KPIs de negócios. À medida que a roda da inovação e do avanço tecnológico continua girando rapidamente na Salesforce Research e no setor, continuamos nos movendo na velocidade da luz para aproveitar várias inovações e tornar os agentes ainda mais robustos e inteligentes. Alguns dos avanços que os clientes podem esperar num futuro próximo:

  • Uma estrutura de teste e avaliação para agentes. Implantar um sistema agêntico complexo como o Agentforce nas empresas exige uma quantidade enorme de testes e validações. Por isso, desenvolvemos uma estrutura de avaliação robusta para testar os resultados da ação, as entradas, as saídas, a precisão do planejamento, a classificação dos tópicos e o estado do planejador. Estamos usando essa estrutura para otimizar os agentes em métricas como precisão, latência, custo de atendimento e confiança. Diferentemente da maioria das estruturas e benchmarks geralmente disponíveis, que se concentram principalmente na avaliação do desempenho de um LLM em tarefas como matemática, ciências e proficiência em conhecimentos gerais, nossa estrutura de avaliação é voltada especificamente para casos de uso de negócios de CRM. Também publicamos o primeiro benchmark de LLMAbre em uma nova janela do mundo e atualmente estamos trabalhando para disponibilizar nossa estrutura de avaliação de agentes para clientes e parceiros.
  • Suporte para múltiplas intenções. Essa é a base fundamental da replicação de um mecanismo de conversação semelhante ao humano. Muitas expressões do dia a dia consistem em várias metas não relacionadas, como “atualizar meu pedido e encontrar uma camisa no tamanho M”, “atualizar o status do caso e enviar um email para o cliente com um resumo das etapas de solução de problemas” e “reservar um voo e um hotel”. Com a combinação dos recursos de compreensão de linguagem natural dos LLMs, suporte a grandes janelas de contexto e nossos conceitos inovadores, como tópicos, continuamos experimentando para criar uma solução confiável, dimensionável e segura para nossos clientes.
  • Suporte multimodal. Embora a maioria das interações digitais seja baseada em texto, as interações baseadas em voz e visão multiplicam a riqueza de experiências, porque representam a forma mais natural de interação humana. Na verdade, com avanços como processamento simultâneo de entradas multimodais, tempos de resposta mais rápidos, grandes janelas de contexto e recursos sofisticados de raciocínio, estima-se que o mercado de IA multimodal cresça cerca de 36% até 2031Abre em uma nova janela. Existem vários casos de uso corporativos que podem se beneficiar imediatamente do suporte multimodal:
    • Casos de uso de voz. Substituir a resposta de voz interativa (IVR) por suporte de voz com IA generativa e orientação, treinamento e integração de funcionários.
    • Casos de uso de visão. Pesquisa e comparação de produtos, navegação na interface do usuário (web, móvel), solução de problemas e resolução de problemas para serviços de campo.
  • Suporte multiagentes. As interações entre agentes representam um dos desenvolvimentos comerciais mais transformadores do nosso tempo. Dada sua capacidade de recuperar, compilar e processar informações simultaneamente, os sistemas multiagentes podem diminuir exponencialmente os tempos de processamento de fluxos de trabalho longos e complexos, que atualmente ocorrem sequencialmente devido à transferência de pessoa para pessoa. Agentes digitais podem ser inseridos nesses fluxos de trabalho para tarefas repetíveis de processamento de dados e também podem ajudar os humanos envolvidos nesses processos a serem mais eficientes.

    Já estamos introduzindo esse tipo de paradigma multiagentes no processo de vendas, em que um agente pode atuar como representante de desenvolvimento de vendas para estimular o funil, ou como coach de vendas para orientar um representante de vendas sobre a melhor forma de negociar. Agentes especializados também podem lidar com outros aspectos do processo de vendas, como qualificação de leads, preparação de propostas e acompanhamento pós-venda. Da mesma forma, um fluxo de trabalho de atendimento pode consistir em agentes que solucionam problemas, acompanham e atribuem tickets, bem como agentes que respondem às consultas dos clientes e ajudam representantes humanos.

Prepare-se para a terceira onda da IA

O Agentforce representa a terceira onda da IA, depois da IA preditiva e dos copilotos. Usando o Agentforce, os clientes podem criar agentes que não apenas respondam a prompts de conversação para agir, mas também antecipem, planejem e raciocinem com o mínimo de ajuda. Os agentes podem automatizar fluxos de trabalho ou processos inteiros, tomar decisões e se adaptar a novas informações, tudo sem intervenção humana. Ao mesmo tempo, esses agentes podem garantir uma transferência perfeita para colaboradores humanos, facilitando a colaboração em todas as linhas de negócios. Baseados no Mecanismo de raciocínio Atlas, esses agentes podem ser implantados com apenas alguns cliques para ampliar e transformar qualquer função de negócios ou equipe.