Skip to Content
フッターにスキップ

高度な推論エンジンは、次世代のAIエージェントをどう動かしているか

※本記事は2024年12月17日に米国で公開されたHow an Advanced Reasoning Engine Is Powering the Next Generation of AI Agentsの抄訳です。本記事の正式言語は英語であり、その内容および解釈については英語が優先されます。


すべてのAIエージェントには推論能力が必要です。推論能力こそが、分析、適応、意味のある意思決定を行う能力をもたらすからです。しかし、SalesforceのAgentforce(英語)が登場するまで、生データとメタデータを、人間の思考を模倣する、あるいはそれを上回る高度なアクションに変換するための、真のエンタープライズクラスの推論エンジンを備えたAIエージェント、AI Copilot、AIアシスタントは存在しませんでした。

Salesforce AIリサーチ製品・エンジニアリング責任者、テクノロジー担当SVPのフィル・ムイ(Phil Mui)は次のように述べています。「推論エンジンは、モデル、データ、ビジネスロジック、イベント、ワークフローを統合した認知アーキテクチャです。推論エンジンは複合システムであり、優れた推論エンジンとは、推論時間の速い『システム2*』の推論エンジンです。ユーザークエリやコンテキストのニュアンスを理解し、正確で忠実な、時には実用的な回答を提供しようとします」

*訳注:「システム1」は直観的、「システム2」は熟慮的。

推論エンジンは、モデル、データ、ビジネスロジック、イベント、ワークフローを統合した認知アーキテクチャです

フィル・ムイ(Phil Mui) Salesforce AIリサーチ製品・エンジニアリング責任者、テクノロジー担当SVP

これは、スクリプト化されたプロンプトと予測不可能な返答を伴う、私たちが知るようになったAIアシスタントからの顕著な変化です。著名な心理学者ダニエル・カーネマンのベストセラー『ファスト&スロー』から着想を得た推論エンジンは、人間の思考の二重プロセスのフレームワークを統合しています。これは、状況に応じて瞬時に反応できる場合があるという考えです。あるいは、時間をかけて物事をより深く考え、問題やニーズに対してより複雑な解決策を導き出すこともできます。

AIの用語で言えば、多くのDIY(Do It Yourself)による自作のAIアシスタントは、基本的に大規模言語モデル(LLM)(英語)の上に薄いソフトウェアのベニヤ板をかぶせたもので、よくある質問に答えたり、商品の注文を受けたりするような基本的なタスクのために作られているため、最初の高速な、つまり「システム1」の道を進みます。しかし、人間の作業を代替したり、補強するためにAIエージェントを採用しようと考えている組織は、より高いレベルの推論を必要としています。そこで、状況を理解して考え抜き、関連するインサイトを提供し、実行を提案する能力を持つ「システム2」推論が登場します。

素早い修正から熟考されたソリューションまで

これが、企業向け初となるデジタル労働力を生み出すプラットフォームであるAgentforceの特徴です。Agentforceの 「頭脳 」であるAtlas推論エンジンは、システム2の推論機能を使用することで、最も関連性の高いデータを取得し、推論し、実行することで、カスタマーサービス、セールス、オペレーション全体のプロセスを大幅に改善します。要望を受けると、AtlasはAgentforceがクエリを絞り込むことを可能にし、追加のコンテキストでクエリを拡張し、さらに自身のレスポンスの品質を評価しながら関連するデータとメタデータを取り込む高度な検索拡張生成(RAG)を実行します。質問に答え、再度回答しようとする前にその答えを熟考するこの機能により、Salesforceに深いデータやメタデータのコンテキストを持たない他のシステム2 のAIアシスタントと比較して、より正確な回答と的確なアクションが可能になります。

このような段階を踏んだ慎重な思考は、最も懸念すべきAIの落とし穴のひとつであるハルシネーションを最小限に抑えることにも役立ちます。実際、Salesforceの新たな調査によると、78%の従業員(英語)は、AIエージェントが誤った回答をした場合、その使用を中止するだろうと回答しています。システム1の高速かつ本能的な反応時間は、単純な問い合わせには対応できますが、複雑または曖昧な場面ではうまく機能しないことが多く、LLMが知識の空白を埋める余地を残してしまいます。その本物のように見えるものの不正確な結果を提供することで、ビジネスに重大なリスクをもたらします。

商業用AIチャットボットのハルシネーション率は3%から最高で27%にも達する(英語)ため、慎重でコンテキストを重視したシステム2の分析の価値は明らかです。より深い推論に基づいた意思決定を行うことで、エラーを減らし、複雑な質問に対してより完全でニュアンスに富んだ回答を提供することができます。システム2の推論を使用するAIエージェントは、ビジネスデータと顧客データを統合し、調和させるSalesforce Data Cloudなどのソリューションによってさらに強化され、よりコンテキストに即した実行可能なインサイトを提供しながら、ハルシネーションのリスクを最小限に抑えます。これには、Agentforceが回答を作成する際に参照したソースをインラインで示す引用も含まれます。

Salesforce AIの機械学習およびエンジニアリング担当VPであるクレア・チェン(Claire Cheng)は、次のように述べています。「制限がないリクエストがあると、LLMがハルシネーションを起こす可能性があることは周知の事実です。しかし、ビジネス領域や顧客データにアクセスすることで、AIエージェントはより優れた推論を行い、リクエストのコンテキストを理解して、よりパーソナライズされた適切な応答を行うことができます」

また、チェンは次のような例を挙げています:銀行の顧客がAIエージェントに対して、金利変動がポートフォリオにどのような影響を与えるか説明を求めたと想像してみてください。これは複雑な質問です。一般的なRAGシステムや単純なAIアシスタントでは、おそらく公開されているナレッジ記事に基づいて初歩的な回答が生成されるでしょう。しかし、顧客が投資口座にどれくらいの金額を保有しているか、あるいは金利変動の影響を受けやすい可能性があるファンドを特定する方法に関する銀行のガイダンスなど、その他の関連性の高い考慮事項を評価することはできないでしょう。

より高度なレベルのデータ検索と推論を実行できるAIエージェントは、銀行顧客の投資戦略についてより包括的で詳細な調査に基づくアドバイスを提供し、場合によっては社内の財務アドバイザーの選択肢をいくつか提案して意思決定を導くことさえできるでしょう。

例えば、推論エンジンがカスタマーサポートの問い合わせを分析する際には、ユーザーの問い合わせに対して単に一つの回答を提供するだけではありません。検索されたすべてのテキストを評価し、最も関連性の高いテキストを再びランク付けし、最終的な応答をユーザーの問い合わせに関連するものだけに基づいて合成します。高度な問い合わせ処理技術とメタデータで強化されたインデックスを活用することで、Agentforceの顧客は、Atlasの初期パイロットテストで確認されたように、回答の精度においてDIY AIソリューションよりも33%改善され、応答の関連性も2倍に高めることができました。

理由を見いだす企業

大半の企業にとって、AI CopilotとAIエージェントのどちらを選ぶかは明白である、とチェンは言っています。 大学生のインターンや新入社員が応対できるような一般的な質問への回答だけで十分であれば、従来のAIアシスタントやAI Copilotで問題ありません。しかし、より高度な専門知識が必要であれば、推論エンジンを搭載したAIエージェントが必要となります。

すでに数多くの企業が、こうした推論能力を活用しています。 例えば、人材ソリューションの世界的リーダーであるアデコグループ(英語)は、採用AIアシスタントと候補者向けAIコンシェルジュの両方の役割を果たすAgentforceによって採用業務を変革しています。 Agentforceは24時間365日体制で稼働し、何百万もの履歴書を効率的に処理し、候補者を厳選された求人案件にマッチングさせ、事前に選別します。また、候補者が履歴書を改善できるよう支援し、採用プロセスを合理化して、潜在能力を最大限に引き出します。 プレミアムデジタルタブレット企業であるreMarkable社(英語)は、カスタマーサービスとコマース機能を提供するために、AgentforceとSalesforceのB2B Commerceソリューションを併用しています。Agentforceが一般的な問い合わせに対応することで、人間のオペレーターはより複雑なニーズや影響力の大きい顧客への対応に集中することができます。また、中小企業向け会計事務所大手の1-800 Accountant社(英語)は、Agentforceを使用して一般的な問い合わせを管理しており、その結果、寄せられる問い合わせの65%を回避できると見込んでいます。

すでに数多くの企業が、こうした推論能力を活用しています

これらは、システム2の推論と顧客データに基づいたAIエージェントが提供する潜在能力の一部に過ぎません。実際、役割ベースのAIエージェント、データ統合、ワークフローの自動化を組み合わせることで、企業はあらゆる機能においてAIエージェント・テクノロジーのメリットを享受できます。

推論エンジンの次なる進化は?

AIの進化に伴い、推論エンジンは自律型AIエージェントの能力向上に重要な役割を果たすでしょう。ムイは、これらのシステムはさらに高度化し、AIエージェントが汎用アシスタントとしてではなく、特定分野の専門家として機能する能力を備えるようになることで、これらのシステムはさらに熟練したものになると予測しています。

推論エンジンは、ますます複雑化するやり取りに対応するために進化していくでしょう。新たに発表されたAgentforce 2.0は、より深い思考を必要とする複数のレイヤーを含む、より多様なやり取りを処理することができます。例えば、「私のポートフォリオの状況は?」といった単純な質問には、素早い回答のために基本的な推論が用いられます。一方で、「私の収入とリスクの優先順位に基づく、子供の大学の資金として最適な投資手段とは?」といったより深い質問には、高度なデータ検索機能を使って推論を強化します。Data Cloudから関連データとコンテキスト固有のメタデータを取得する前に検索を絞り込むことで、回答の精度が向上します。

「Agentforceのこの新しいバージョンと以前のバージョンの違いは、より深い推論が可能になり、より高度なテクノロジーでデータを取得し、単純な回答だけでなく、実用的な回答を生成できるようになったことです」とチェンは述べています。

Agentforceのこの新しいバージョンと以前のバージョンの違いは、より深い推論が可能になり、より高度なテクノロジーでデータを取得し、単純な回答だけでなく、実用的な回答を生成できるようになったことです

Salesforce AI 機械学習およびエンジニアリング担当VP、クレア・チェン(Claire Cheng)

将来、マルチAIエージェントシステムとコラボレーティブAIが進歩すれば、推論エンジンの可能性はさらに広がるでしょう。専門に特化したAIエージェントを連携させることで、企業はサプライチェーンの最適化から個別化医療に至るまで、多様な専門知識を必要とする複雑な課題に取り組むことができるようになります。 やがては、推論エンジンが、さまざまなプロジェクトで複数のAIエージェントが連携して作業するために必要なものも提供するようになるでしょう。 例えば、新製品を発売するマーケティング担当者は、キャンペーンの構築を支援する推論エンジン搭載のAIエージェントを採用するかもしれません。そのAIエージェントはアウトバウンドコールを行うAIエージェントと連携し、関連するチャネルを通じてそのキャンペーンを展開し、顧客からの質問に対応します。その後、コマースに特化したAIエージェントに引き継ぎ、取引を完了させます。

現時点では、システム1からシステム2の推論への飛躍は、AI開発における変革の瞬間を象徴しています。高度な推論エンジンを統合することで、Salesforceのような企業は、より正確で信頼性が高く、実際のビジネスニーズの複雑さに適応したAIシステムの道を切り開こうとしています。

「今後数年のうちに、私たちはより有能なAIエージェントのエキスパートを提供できるようになるでしょう」とチェンは述べています。「推論エンジンは、企業組織がデジタル労働の選択肢を比較検討する際に、最初に考慮する要因のひとつとなるはずです」

詳細情報:

  • Atlas推論エンジンをさらに詳しく知るにはこちら。フィル・ムイとのQ&Aはこちら(英語)。
  • 最新のAgentforceニュースはこちら
  • Agentforceの詳細はこちら、Data Cloudの詳細はこちら
  • Agentforceの顧客事例はこちら(英語)。

本記事、または公式に言及されている未提供のサービスや機能は現在利用できないものであり、予定通りに、または全く提供されない可能性があります。お客様は、現在利用可能な機能に基づいて購入をご判断くださいますようお願いいたします。