コレクション登録
FileBlogトーク用のシステム設定(http(s)://xxx/filetalk)で各種設定を行います。
コレクションは任意の設定です。
コレクションには2つの用途があります。
AIチャットでの質問時に表示させるヒントメニューの構築
ベクトル検索できるようにするためのベクトルインデックスデータ構築
コレクションの指定条件の対象ファイルについては、ベクトル検索用のインデックスデータが作成されます。
AIチャットの使用方法が、ベクトル検索を要しないLLMを呼び出すだけの会話(質問や要求)の実行のみであれば、コレクションの登録は不要です。
[1]コレクション定義の登録
システム設定で[コレクション]を選択します。
画面右上の[新規作成]を選択してコレクションの定義を登録します。
各項目を次のように設定します(最小構成の例)。
[QdrantCollectionName]:名称を登録します。半角英数字が使用でき大小文字は区別されます。チャット設定で参照する[ヒント生成元コレクション]のキーになります。
[Directory]:ベクトルインデックス登録対象となるFileBlogのフォルダパスを設定します。広すぎない範囲のフォルダを指定してください。ベクトルインデックス登録時にプロバイダーの従量課金対象となる可能性があります。
[EmbeddingModel]:[変更]を選択して、ベクトルインデックス構築に用いるプロバイダー/モデルを指定します。
設定を保存します(サービス再起動は不要です)
コレクション設定項目
設定項目 |
説 明 |
|---|---|
QdrantCollectionName |
コレクションの名前(識別子)です。 |
Directory |
指定フォルダの配下にあるファイルがベクトルインデックスデータの構築対象になります。 |
SearchQuery |
対象ファイルを抽出するための検索式です。標準既定の |
EmbeddingModel |
プロバイダーとLLMモデルを選択します。LLMがデータのベクトル化を行います。 |
ChunkSize |
ベクトル化のために分割するトークン数の単位です。 値いが大きいほどノイズが増えて精度が低下する傾向です。 |
ChunkOverlap |
分割時に前後で重複させるトークン数です。文脈が保持され検索漏れを防いだり回答品質の向上に役立ちます。値いが大きいほどチャンク数が増えて応答時間、利用コスト、メモリ使用量が増える傾向です。 |
[2]インデックスデータの構築
登録したコレクションのベクトルインデックスデータを構築します。
[3]インデックスデータの定期更新
ベクトルインデックスデータは、ファイル更新を検知して実行される即時更新には対応していません。インデックス再構築のタスクを定義して定期実行することが必要です。
[管理ツール > 設定全般 > クイックアクセス > タスクスケジュール > TaskScheduler]を選択します。
タスクを新規作成(追加)して[アクション > 追加 > 任意コマンド > ベクトルインデックス再構築]を指定します。
定期実行の[スケジュール]を指定します。
設定を保存します。(サービス再起動は不要です)
[4]コレクションの公開
会話形式ではなく、自然文でベクトル検索する画面を公開できます。
ポータル機能を使ってベクトル検索の画面を表示させます。