🔍 検索テストとは
ファイル解析完了後、「検索テスト」ページでデータセットの検索精度を確認し、最適な設定に調整することができます。 実際にユーザーが入力しそうな質問を投げかけ、期待通りのドキュメントがヒットするかを確認しましょう。
🧪 テスト手順
1
テスト質問の入力
画面左側の入力ボックスに、検索したいキーワードや質問文を入力します。
- 例: 「就業規則について教えて」「VPN接続のエラー対処法」
2
テスト実行
「テスト」ボタンをクリックします。システムがナレッジベース内を検索し、関連度の高いチャンク(文章の塊)を表示します。
3
結果の確認と調整
期待するドキュメントが表示されているか確認します。
もし意図しない結果が出る場合は、右側のパラメータを調整して再テストします。
⚙️ パラメータ設定
検索精度をチューニングするための重要な設定項目です。類似度しきい値
「どれくらい似ている情報を拾うか」の基準値です。
- 高い値 (0.7~): 確実に関連する情報だけを厳選します(取りこぼしが増える可能性あり)。
- 低い値 (~0.5): 関連性が薄い情報も広く拾います(ノイズが増える可能性あり)。
ベクトル検索の影響度
「キーワード一致」と「意味の類似」のバランスを調整します。
- 1.0 (デフォルト): ベクトル検索(意味の類似)のみを使用。
- 値を下げる: キーワード検索(完全一致)の比重が増えます。固有名詞や型番などを検索する場合に有効です。
検索結果数 (Top K)
取得する情報の最大件数です。
- 多くの情報を参照させたい場合は増やしますが、多すぎるとLLMが混乱する原因になります(通常は3〜5件推奨)。
検索結果の最適化 (Rerank)
検索結果をAIが再評価して並び替える機能です。
- ON: 精度が向上しますが、処理に少し時間がかかります。
- OFF: 高速ですが、順位付けの精度は標準的です。
