アカデミー
最初のAIエージェントを構築して公開する方法
AIエージェントのリリース後に測定・監視・改善する方法
8
your-first-ai-agent
8
7
6
5
4
2
3
1
5
15
11
9
20
18
19
17
16
15
14
13
12
11
10
8
7
6
5
4
3
2
1
10
18
17
16
14
13
12
10
9
8
7
6
4
3
2
1
9
8
7
6
5
4
3
2
1
7
6
5
4
3
2
1
6
5
4
3
2
1
次のレッスン
次のレッスン
このレッスンで

エージェントプロジェクトの成功基準を定めなければ、成功する方法がありません。

チームはエージェントを立ち上げ、多少の活動を確認しますが、それが実際にビジネスに役立っているかどうかを見失いがちです。動いているエージェントとは、単に稼働しているものではありません。

設定した目標に沿った、測定可能で再現性のある成果を生み出すものです。

このレッスンでは、本当に重要なことを測定する習慣を身につけることについて学びます。見かけだけの指標ではなく、エージェントが実際に業務を行っていることを証明する指標です。成功は、価値を明確に定義することから始まります。

その答えは、ビジネスの成果に直接結びついている必要があります。

例えば:

  • サポートリクエストの50%を人手を介さずに解決する。
  • 平均購入金額を20%増加させる。
  • 毎週顧客のフィードバックを収集し、要約する。
  • 平均応答時間を半分に短縮する。

これらの目標はすべてシンプルで測定可能、かつ実際の業務ニーズに合致しています。目標を設定したら、それを達成できているかどうかを確認する指標を決めましょう。

AIエージェントにとって最も信頼できる指標は、次の5つのカテゴリに分かれます:

  1. 利用状況 — 一定期間内に発生したセッションややり取りの数。
  2. 解決率 — エージェントがタスクをどれだけ成功裏に完了したか。
  3. エスカレーション率 — 会話がどれくらいの頻度で人に引き継がれたか。
  4. ビジネスへの影響 — 売上、コンバージョン率、満足度スコアなどの成果に結びつく指標。
  5. システムの健全性 — レイテンシ、コスト、エラー率などのパフォーマンスデータ。

5つすべてを追跡することで、顧客体験と技術的な信頼性の両方をバランスよく把握できます。これらの指標が良い方向に動いていれば、エージェントが役割を果たしている証拠です。そうでない場合は、改善に必要な情報が得られます。

Terminal Roastでは、チーム全員が成功の監視を分担することに合意しています。

オーナーのTarynは、顧客の感情や全体的な満足度といった定性的な成果に注目します。

技術リーダーのGideonは、利用状況、完了率、エラーなどの分析ダッシュボードを監視します。

バリスタのAdrianは、エージェントが生成した週次サマリーを確認し、フィードバックが実際に活用できるかを見ています。

チームは週に一度集まり、数値を確認し、調整が必要な点を話し合います。エージェントが会話を人間に引き継ぐ回数が増えた場合は、プロンプトや指示の調整が必要かどうかを確認します。利用率が下がった場合は、ウィジェットがウェブサイト上で見える位置にあり、正常に動作しているかをチェックします。

このような共同責任によって、プロジェクトは継続的に動き続けます。チームはエージェントを一度作って終わりのものではなく、時間とともに進化するシステムとして扱います。成功基準は、どのように改善を重ねていくかも決める指標となります。表面的なデータだけを追っていると、本当の課題を見逃してしまいます。

例えば、会話数が多いと一見良さそうに見えますが、完了率が低ければエージェントは密かに失敗しています。明確な指標の枠組みがあれば、それを防げます。再学習のタイミングやワークフローの見直し、ユーザー体験の調整が必要な時期を判断できます。

リリース後の監視に適した構成例はこちらです:

  1. 主な指標を2~3つ定義し、元の目標に合致させる。
  2. ベースラインを設定し、エージェント導入前の現状プロセスで測定する。
  3. 介入の基準値を決める — 例えばエスカレーション率が20%を超えた場合や、応答時間が設定値を超えた場合など。
  4. 最初は毎週、その後システムが安定したら月次でレビューする。

定量データと定性データの両方を含めましょう。数値は成果を示し、人からのフィードバックは質を示します。

Terminal Roastのチームは、再現性のあるプロセスを確立しました。

フィードバックを集め、小さな改善を加え、その結果を追跡します。すべての改善は推測ではなく、証拠に基づいて行われます。

この「測定・調整・繰り返し」のリズムが、エージェントを試験運用から本格的な業務ツールへと進化させます。これは、AIを大規模に活用して成功しているすべてのチームが実践しているリズムです。成功の定義は、単に結果を測るだけではありません。進歩が止まらないようにするためのものです。

アクション: あなたのエージェントに対して、ユーザー体験に関するものとビジネスへの影響に関するもの、それぞれ1つずつ成功指標を2つ書き出しましょう。

チームの誰がどの指標を監視し、リリース後どのくらいの頻度でレビューするかを決めてください。

以上です!このコースで一つだけ覚えておいてほしいのは、構築を始める前のしっかりとした計画が、あなたを大きく前進させるということです。ボット作りを楽しんでください!

概要
AIエージェントの利用状況やパフォーマンスを実際のビジネス成果に結びつけるための成功指標の定め方。
このコースの全レッスン
Fresh green broccoli floret with thick stalks.