評価 - Agentify JP

評価機能は、Agent の回答品質、処理結果、期待値との一致を確認するための機能です。本番運用前の検証や、運用中の品質改善に利用します。

回答品質の確認

回答が正確か、業務ルールに沿っているか、ユーザーに分かりやすいかを確認します。

比較・改善

プロンプト、モデル、ワークフロー変更前後の結果を比較し、改善判断に利用します。

評価観点

正確性: 参照情報やデータベース結果に基づいているか
完全性: 必要な情報が不足していないか
安全性: 不適切な回答や過剰な操作をしていないか
一貫性: 同じ条件で安定した回答が返るか

評価ケースをあらかじめ用意しておくと、モデル変更やワークフロー修正後の確認が効率的になります。

ダッシュボードクローラーマニュアル