Serviceconsole met een chatvenster waarin Einstein helpt bij het beantwoorden van vragen

Hoe de Atlas Reasoning Engine Agentforce aandrijft

Autonome, proactieve AI-agents vormen de kern van Agentforce. Hoe werken ze in de praktijk? Lees snel verder voor het antwoord op deze vragen.

Shipra Gupta

De snelheid van innovatie in de wereld van AI - en in het bijzonder generatieve AI - gaat in een razend tempo door. Met de technische verfijning die nu beschikbaar is, evolueert de industrie snel van ondersteunende gespreksautomatisering naar rolgebaseerde automatisering die het personeelsbestand uitbreidt. Om ervoor te zorgen dat kunstmatige intelligentie (AI) een prestatie op menselijk niveau nabootst, is het van vitaal belang om te begrijpen wat mensen het meest effectief maakt in het voltooien van taken: keuzevrijheid. Mensen kunnen gegevens tot zich nemen, redeneren over mogelijke trajecten en actie ondernemen. Om AI van dit soort mogelijkheden te voorzien, is een extreem hoog niveau van intelligentie en besluitvorming nodig.

Bij Salesforce hebben we gebruik gemaakt van de nieuwste ontwikkelingen op het gebied van grote taalmodellen (LLM's) en redeneertechnieken om Agentforce te lanceren. Agentforce is een reeks out of the box AI-agents - autonome, proactieve applicaties die zijn ontworpen om gespecialiseerde taken uit te voeren - en een set tools om ze te bouwen en aan te passen. Deze autonome AI-agents kunnen op een hoog niveau van complexiteit denken, redeneren, plannen en orkestreren. Agentforce vertegenwoordigt een enorme sprong voorwaarts in AI-automatisering voor klantenservice, verkoop, marketing, commerce en meer.

Dit artikel belicht de innovaties die hebben geleid tot de Atlas Reasoning Engine, het brein van Agentforce, die werd bedacht door Salesforce AI ResearchOpent in een nieuw venster en die acties intelligent en autonoom orkestreert om bedrijven een agentische oplossing op bedrijfsniveau te bieden.

Bereken je ROI met Agentforce.

Ontdek hoeveel tijd en geld je kunt besparen met een team van AI-aangedreven agenten die zij aan zij werken met je werknemers en personeel. Beantwoord gewoon vier eenvoudige vragen om te zien wat er mogelijk is met Agentforce.

De evolutie van Einstein Copilot naar Agentforce

Eerder dit jaar brachten we Einstein Copilot uit, die inmiddels is uitgegroeid tot een Agentforce Agent voor het beheer van klantrelaties (CRM). Einstein Copilot was een generatieve, AI-aangedreven gespreksassistent die zijn intelligentie ontleende aan een mechanisme dat Chain-of-Thought-redeneringOpent in een nieuw venster (CoT) wordt genoemd. In dit mechanisme bootst het AI-systeem besluitvorming in menselijke stijl na door een plan te genereren met een reeks stappen om een doel te bereiken.

Met een op CoT gebaseerde redenering kon Einstein Copilot co-creëren en samenwerken in de workflow. Dit maakte het behoorlijk geavanceerd in vergelijking met traditionele bots, maar het slaagde er niet in om een menselijke intelligentie echt na te bootsen. Het genereerde een plan met een opeenvolging van acties als reactie op taken en voerde die acties vervolgens één voor één uit. Als het plan echter onjuist was, had het geen mogelijkheid om de gebruiker te vragen om het te corrigeren. Dit leidde tot een AI-ervaring die niet adaptief was: gebruikers konden geen nieuwe en nuttige informatie verstrekken naarmate een gesprek vorderde.

Toen we Einstein Copilot aan strenge tests onderwierpen met duizenden verkopers uit onze eigen verkooporganisatie (Org 62), kwamen enkele patronen naar voren:

  • De gesprekservaring in natuurlijke taal van Copilot was veel beter dan traditionele bots, zoals verwacht, maar Copilot bereikte nog niet de 'heilige graal' van echte mensachtige communicatie. Het moest meer conversational zijn.
  • Copilot heeft uitstekend werk geleverd door de gebruikersdoelen te bereiken met de acties waarmee het was geconfigureerd, maar het kon geen vervolgvragen verwerken over informatie die al in het gesprek bestond. Het moest de context beter gebruiken om op meer vragen van gebruikers te reageren.
  • Naarmate we meer acties toevoegden om meer gebruiksscenario's te automatiseren, begonnen de prestaties van Copilot te verslechteren, zowel in termen van latentie (hoe lang het duurde om te reageren) als responskwaliteit. Het moest effectief kunnen worden opgeschaald naar duizenden gebruiksscenario's en applicaties die ervan konden profiteren.

We gingen op zoek naar een oplossing voor deze problemen en dat leidde tot de ontwikkeling van Agentforce.

Agentblazer-personages

Word lid van de Agentblazer-community.

Kom in contact met Agentblazers van over de hele wereld om meer te leren over AI, use cases te ontdekken, te horen van productexperts en meer. Breid je AI-expertise en je carrière uit.

Agentforce: een grote sprong voorwaarts in redeneren

Agentforce is de eerste oplossing voor gespreksautomatisering op bedrijfsniveau die proactieve en intelligente beslissingen op schaal kan nemen met weinig of geen menselijke tussenkomst. Verschillende ontwikkelingen maken dat mogelijk.

  • Orkestratie op basis van ReAct-prompts versus CoT. Uitgebreid experimenteren en testen toonde aan dat Reasoning and Acting (ReAct)-achtige prompting veel betere resultaten opleverde in vergelijking met de CoT-techniek. In het ReAct-mechanisme doorloopt het systeem een lus van redeneren, handelen en observeren totdat een gebruikersdoel is bereikt. Dit type lusbenadering stelt het systeem in staat om nieuwe informatie in overweging te nemen en verhelderende vragen te stellen of bevestigingen te geven, zodat het doel van de gebruiker zo precies mogelijk wordt bereikt. Dit leidt ook tot een veel vloeiendere gesprekservaring met natuurlijkere taal.
  • Classificatie van het onderwerp. We hebben een nieuw concept geïntroduceerd, onderwerpen genaamd, dat is gekoppeld aan de intentie van de gebruiker of de taak die moet worden uitgevoerd. Wanneer gebruikersinvoer plaatsvindt, wordt deze toegewezen aan een onderwerp, dat de relevante set instructies, bedrijfsbeleidsregels en acties bevat om aan dat verzoek te voldoen. Dit mechanisme helpt bij het definiëren van de reikwijdte van de taak en de bijbehorende oplossingsruimte voor de LLM, waardoor het systeem moeiteloos kan worden geschaald. Instructies in natuurlijke taal die in onderwerpen zijn ingesloten, bieden extra richtlijnen en vangrails voor de LLM. Dus als we een aantal acties nodig hebben die in een bepaalde volgorde moeten worden uitgevoerd, kan dat een onderwerpinstructie in natuurlijke taal zijn. Als er bedrijfsbeleid is, zoals 'gratis retourneren tot 30 dagen', kan dit beleid als instructie worden gespecificeerd en worden doorgegeven aan de LLM, zodat deze hiermee rekening kan houden en de gebruikersinteractie dienovereenkomstig kan aanpassen. Met deze concepten kunnen agents veilig en beveiligd schalen naar duizenden acties.
  • Gebruik LLM's voor reacties. Voorheen stelden we het systeem alleen in staat om te reageren met actie-outputs, wat het vermogen om te reageren op basis van de beschikbare informatie in het gesprek aanzienlijk beperkte. Door het systeem zo open te stellen dat de LLM reageert met behulp van de context in de gespreksgeschiedenis, hebben we een veel rijkere gesprekservaring mogelijk gemaakt. Nu kunnen gebruikers om verduidelijking vragen en vervolgvragen stellen bij eerdere outputs, wat leidt tot een hogere algehele vervullingsgraad voor doelen.
  • Gedachten/redeneringen. Door LLM's aan te sporen hun gedachten te delen of redenen te geven voor bepaalde acties, worden hallucinaties aanzienlijk voorkomen. Dit heeft als bijkomend voordeel dat het inzicht biedt in het gedrag van de LLM, zodat beheerders en ontwikkelaars de agent kunnen afstemmen op hun behoeften. Redeneren is standaard beschikbaar bij Agent Builder en gebruikers kunnen de agent ook vervolgvragen stellen, zodat deze zijn redenering kan uitleggen. Dit voorkomt niet alleen hallucinaties, maar helpt ook bij het opbouwen van vertrouwen.

Aanvullende Agentforce kenmerken

Buiten de Atlas Reasoning Engine heeft Agentforce verschillende andere opmerkelijke kenmerken die het onderscheiden.

  • Proactieve actie. Gebruikersinvoer is een manier om agents te activeren. Maar Agentforce agents kunnen ook worden getriggerd door gegevensbewerkingen op CRM of bedrijfsprocessen en -regels, zoals een statusupdate van een case, een e-mail die door een merk wordt ontvangen of een vergadering die over vijf minuten begint. Deze mechanismen geven agents een niveau van proactiviteit dat hen nuttig en inzetbaar maakt in verschillende dynamische bedrijfsomgevingen, waardoor hun bruikbaarheid wordt uitgebreid naar zowel de front office als de back office.
  • Dynamisch ophalen van informatie. De meeste zakelijke use cases hebben betrekking op het ophalen van informatie of het ondernemen van actie. Een van de meest voorkomende mechanismen om statische informatie aan agents door te geven, is door middel van aarding. Het is echter het vermogen van agents om dynamische informatie aan te boren dat een enorm potentieel aan use cases en applicaties ontsluit.

    Agentforce ondersteunt verschillende mechanismen om dynamische informatie aan te boren. De eerste is retrieval augmented generation, of RAG. Door semantisch te zoeken op gestructureerde en ongestructureerde gegevens in Data Cloud via RAG, kunnen agents alle relevante informatie ophalen uit externe gegevensbronnen en databases.

    Ten tweede hebben we met de introductie van generieke tools voor het ophalen van informatie, zoals zoeken op het web en vragen en antwoorden over kennis, het vermogen van de agent om complexe taken uit te voeren vergroot. Stel je eens voor dat je online onderzoek doet naar een bedrijf of een product met behulp van zoeken op internet en dat combineert met interne kennis over de regels en het beleid van het bedrijf, en vervolgens een actie onderneemt in de vorm van een e-mailsamenvatting naar een contactpersoon. Door gegevens uit meerdere bronnen te combineren, kan de agent zakelijke taken veel effectiever en efficiënter afhandelen.

    Ten slotte kunnen agents worden ingezet in stromen, API's en Apex-klassen. Hierdoor kan alle contextuele informatie in een workflow, evenals informatie voor verschillende scenario's, worden doorgegeven aan de agent, waardoor het niet nodig is om aangepaste oplossingen te bouwen en elk scenario afzonderlijk te behandelen. Met al deze mechanismen om dynamische informatie aan te boren, kunnen agents hun omgeving beter begrijpen, wat hun interactiviteit aanzienlijk verbetert.
  • Overdracht aan menselijke agent. AI is niet-deterministisch en kan hallucineren. Daarom zijn we een pionier op het gebied van de robuuste Einstein Trust Layer om toxiciteitsdetectie, contracten zonder gegevensretentie, verdediging tegen snelle injectie en verschillende andere mechanismen te bieden. We hebben prompts in ons systeem ingebouwd om te voorkomen dat LLM's afdwalen en hallucineren. Ondanks al deze mechanismen zijn LLM's echter nog steeds niet 100% nauwkeurig. Voor kritieke bedrijfsscenario's waarin de tolerantie voor fouten nul is, is een naadloze overdracht naar een mens van cruciaal belang. Agentforce biedt hiervoor native support. Agentforce behandelt 'overdracht aan een menselijke agent' als slechts een andere actie, waardoor een gesprek veilig en naadloos kan worden overgedragen aan mensen in elk gewenst bedrijfsscenario.

Wat biedt de toekomst voor Agentforce

Ondanks dat het nog in de kinderschoenen staat, is Agentforce een game-changer voor onze klanten. Klanten als Wiley en Saks Fifth Avenue zien met Agentforce Service Agent een exponentiële impact op hun zakelijke KPI's. Terwijl innovatie en technologische vooruitgang bij Salesforce Research en binnen de sector alsmaar doorgaan, werken we op topsnelheid aan verschillende innovaties om agents nog robuuster en intelligenter te maken. Enkele van de ontwikkelingen die klanten in de nabije toekomst kunnen verwachten, zijn onder meer:

  • Een test- en evaluatiekader voor agents. Het introduceren van een complex agentisch systeem zoals Agentforce in ondernemingen vereist enorm veel testen en validatie. Daarom hebben we een robuust evaluatiekader ontwikkeld om de actieresultaten, input, output, planningsnauwkeurigheid, onderwerpclassificatie en planningsstatus te testen. We hebben dit framework gebruikt om de agents te optimaliseren op basis van statistieken zoals nauwkeurigheid, latentie, servicekosten en vertrouwen. In tegenstelling tot de meeste algemeen beschikbare frameworks en benchmarks die zich voornamelijk richten op het evalueren van de prestaties van een LLM met betrekking tot taken zoals wiskunde, wetenschap en algemene kennisvaardigheid, is ons evaluatiekader specifiek gericht op zakelijke CRM use cases. We hebben ook 's werelds eerste LLM-benchmarkOpent in een nieuw venster gepubliceerd en werken momenteel aan het beschikbaar maken van ons evaluatiekader voor agents voor klanten en partners.
  • Support voor meerdere intenties. Dit is een belangrijke hoeksteen van het nabootsen van een mensachtig gespreksmechanisme. Heel wat dagelijkse uitdrukkingen bestaan uit meerdere niet-gerelateerde doelen, zoals 'werk mijn bestelling bij en zoek een shirt in maat M', 'werk de status van de case bij en e-mail een samenvatting van de stappen voor probleemoplossing naar de klant' en 'boek een vlucht en reserveer een hotel'. Met de combinatie van de mogelijkheden voor het begrijpen van natuurlijke taal van LLM's, support voor vensters met grote context en onze innovatieve concepten zoals onderwerpen, blijven we experimenteren om een betrouwbare, schaalbare en veilige oplossing voor onze klanten te creëren.
  • Multimodale support. Hoewel de meeste digitale interacties op tekst zijn gebaseerd, bieden interacties op basis van spraak en beeld een veel uitgebreidere ervaring omdat ze de natuurlijkste manier van menselijke interactie vertegenwoordigen. Met ontwikkelingen zoals gelijktijdige verwerking van multimodale inputs, snellere responstijden, vensters met grote contexten en geavanceerde redeneermogelijkhedenzal de multimodale AI-markt tegen 2031Opent in een nieuw venster naar verwachting met ongeveer 36% groeien. Er zijn verschillende use cases voor bedrijven die direct kunnen profiteren van multimodale support:
    • Use cases op basis van spraak. Interactieve spraakrespons (IVR) vervangen door generatieve AI-gestuurde spraakondersteuning, coaching van werknemers, training en onboarding.
    • Use cases op basis van beeld. Zoeken en vergelijken van producten, browsen in de gebruikersinterface (web, mobiel), probleemoplossing en probleemoplossing voor de buitendienst.
  • Support voor meerdere agents. Agent-to-agent-interacties zijn een van de meest transformerende zakelijke ontwikkelingen van onze tijd. Gezien hun vermogen om tegelijkertijd informatie op te halen, te compileren en te verwerken, kunnen multi-agentsystemen de verwerkingstijden exponentieel verkorten voor lange, complexe workflows die momenteel opeenvolgend verlopen als gevolg van de overdracht van mens tot mens. Digitale agents kunnen in deze workflows worden ingevoegd voor herhaalbare gegevensverwerkingstaken en ze kunnen mensen die bij deze processen betrokken zijn ook helpen efficiënter te zijn.

    We introduceren zo'n multi-agentparadigma al in het verkoopproces, waarbij een agent kan fungeren als een verkoopontwikkelingsvertegenwoordiger om de pijplijn te nurturen, of als een verkoopcoach om verkopers te adviseren over hoe ze het beste over een deal kunnen onderhandelen. Gespecialiseerde agents kunnen ook andere aspecten van het verkoopproces afhandelen, zoals leadkwalificatie, voorbereiding van voorstellen en follow-up na verkoop. Op dezelfde manier kan een serviceworkflow bestaan uit agents die problemen oplossen, problemen opvolgen en tickets toewijzen, maar ook uit agents die reageren op vragen van klanten en menselijke vertegenwoordigers helpen.

Bereid je voor op de derde golf van AI

Agentforce vertegenwoordigt de derde golf van AI, na voorspellende AI en copiloten. Met behulp van Agentforce kunnen klanten agents bouwen die niet alleen reageren op gespreksprompts om actie te ondernemen, maar ook anticiperen, plannen en redeneren met minimale hulp. Medewerkers kunnen volledige workflows of processen automatiseren, beslissingen nemen en zich aanpassen aan nieuwe informatie, allemaal zonder menselijke tussenkomst. Tegelijkertijd kunnen deze agents zorgen voor een naadloze overdracht aan menselijke werknemers, waardoor de samenwerking in elke bedrijfstak wordt vergemakkelijkt. Aangedreven door de Atlas Reasoning Engine kunnen deze agents in slechts een paar klikken worden ingezet om elke bedrijfsfunctie of elk team te versterken en te transformeren.