Skip to main content

Documentation Index

Fetch the complete documentation index at: https://docs.agentify.jp/llms.txt

Use this file to discover all available pages before exploring further.

評価機能は、Agent の回答品質、処理結果、期待値との一致を確認するための機能です。本番運用前の検証や、運用中の品質改善に利用します。

回答品質の確認

回答が正確か、業務ルールに沿っているか、ユーザーに分かりやすいかを確認します。

比較・改善

プロンプト、モデル、ワークフロー変更前後の結果を比較し、改善判断に利用します。

評価観点

  • 正確性: 参照情報やデータベース結果に基づいているか
  • 完全性: 必要な情報が不足していないか
  • 安全性: 不適切な回答や過剰な操作をしていないか
  • 一貫性: 同じ条件で安定した回答が返るか
評価ケースをあらかじめ用意しておくと、モデル変更やワークフロー修正後の確認が効率的になります。