インデックス構築

<< Click to Display Table of Contents >>

Navigation:  システム管理者リファレンス > 導入作業 >

インデックス構築

 

検索インデックス・プレビューの初期構築

FileBlogの導入・設定後、文書を検索できるように各文書のインデックスを検索エンジンに登録する必要があります。

あらかじめ、サムネイルやプレビュー画像を作成しておくと、ユーザーがフォルダやファイルを開くと直ぐにプレビュー閲覧できるようになります。

この検索インデックスおよびプレビューの初期構築は、文書量や文書種類、サーバー性能により長時間を要することがあります。

初期構築をスムーズに完了させるために、インデックスの初期構築期間はユーザーにFileBlogの利用を公開せず、初期構築に専念させることをおすすめします。

 

フォルダ変更検知の一時停止

FileBlogは、ドキュメントルートフォルダの変更をリアルタイムで監視し、変更を検知すると検索インデックスを更新します。

FileBlogのインデックス初期構築期間中もファイルサーバーは通常通りに利用されると考えられ、ファイルの変更が頻繁に行われる可能性があります。

FileBlogは、検出されたファイル変更の更新処理を随時行うため、インデックスの初期構築・プレビューの初期作成の処理に影響があり、処理時間が滞るおそれがあります。

ファイル変更が頻繁に発生する環境でインデックス初期構築を行う場合は、フォルダ変更検知を一時停止することでファイル変更の影響を受けないようになります。平日で初期構築実行や文書量が多い環境での実行時におすすめです。

 

フォルダ変更検知を有効・無効にする

画面下部のシステム設定 > ドキュメントルート を開きます。

変更検知の設定を変更するドキュメントルートを選択します。

「フォルダ変更検知」にチェックを入れると変更検知は有効になり、チェックを外すと無効になります。
各ドキュメントルートで有効/無効を設定します。

0234

「保存する」を選択してサービスを再起動すると設定が反映されます。

 

インデックス構築(初回)の実行

インデックス構築を行うには2つの方法があります。

トップやドキュメントルート毎に再構築する場合

 画面下部のシステム設定 > インデックス構築状況 > インデックス再構築ボタン を選択する。
 Ver3.14.0以降、チェックしたドキュメントルートのみを対象に再構築できるようになりました。

特定のフォルダ以下を再構築する場合

 ファイル一覧画面にてインデックス構築を行うフォルダを右クリック > 管理者メニュー > インデックス/プレビュー再構築 を選択する。

再構築ダイアログが表示されたら、「検索インデックス登録を行う」と「プレビュー抽出」にチェックを入れて実行します。

 

初回インデックス構築状況の確認

インデックス構築は次のように進行していきます。

画面下部のシステム設定 > インデックス構築状況 を選択すると状況を確認できます。

 

フォルダスキャン

ドキュメントルートの全フォルダと全ファイルをスキャンして、ファイル一覧を作成します。

スキャンするだけなの処理なので高速に行われます。

スキャンが完了後、再表示ボタンを選択してカウント数を確認します。

0034

 

検索インデックス構築

スキャンが完了すると、テキスト抽出および検索インデックス登録の処理がスタートします。

この処理では、フォルダとファイルを読み取ってテキストを抽出し、抽出したテキストを検索エンジンに登録します。

文書数に応じて数時間~数十時間を要します。

サーバーの性能により、パフォーマンスのチューニングを行うことで処理時間を大幅に短縮できます。

※ 検索インデックス構築、プレビュー抽出処理の進捗状況は、処理中のステータスで確認できます。

  検索インデックス登録の残件数は、テキスト抽出した後にキュー(待ち行列)に登録されるため、一様に減少していくわけではありません。

 

インデックス登録数の確認

インデックス登録数を確認するには、「取得」ボタンを選択します。文書数部の「取得」ボタンですべてのドキュメントルートの登録数を表示できます。

0213

インデックスの同期

検索エンジンは、(初期状態では)メモリにキャッシュしたインデックスを2000件に1回のタイミングでディスクへ書き込見ます。タイミングによって文書が登録されていないように見えることがあります。

書き込みを手動で行うには「インデックス同期」ボタンを選択します。その後に「取得」ボタンを選択すると登録数を確認できます。

0214

 

処理完了まで待ちきれない場合は?

インデックス構築処理の実行途中でも、検索エンジンを停止することができます。

検索エンジンを再起動すると、中断地点からインデックス構築処理を自動的に再開します。

処理の途中で中断し、パフォーマンスのチューニングを行うこともできます。

また、サーバー(OS)を再起動した場合も、中断した地点からインデックス構築処理を自動的に再開します。

 

サーバーのコンソールがフリーズして困ったら

インデックスの初期構築は、大変負荷の重い処理です。

検索サーバーが「バックグラウンドタスク優先」に構成された環境だと、インデックス構築処理がCPUを100%近く占有した場合、マウスカーソルが動かなくなったり、キーボード入力が受け付けられなくなったりすることがあります。

このような症状を予防するには次の方法が有効です。

FileBlogにログインするためのWebブラウザは、サーバーマシンとは別の端末から行う方が安全です。

サーバーのコンソールでは、不要なアプリケーションを起動しないようにしてください。

 

万一、コンソールが入力を受付けなくなった場合には、リモートマシンからサーバーで稼動する検索エンジン(インデクサーサービス)を停止することで、サーバーの負荷を落ち着かせることができます。

コマンドプロンプトから下記のコマンドをご利用下さい。

> sc \\ServerName stop Fb3Indxer

「sc」コマンドで、サーバー(ServerName)のFb3Indxerサービス(インデクサー)に停止要求を投げることができます。

ServerName の部分は実際のコンピューター名に合わせてください。

 

停止要求の受け付けの可否は次のコマンドで確認できます。

> sc \\ServerName query Fb3Indxer

oSTATUS: RUNNING                停止要求をまだ受付けていません。

oSTATUS: STOP_PENDING                停止中。STOPPEDは停止状態です。

 

プレビュー抽出

プレビュー抽出処理は、負荷の大きな処理ですので、特に初回構築時には長時間を要します。

印刷処理と同等のため、1ページあたり1秒程度を要します。

 

ファイル変更検知の再開

プレビュー作成まで完了したら、ファイルの変更検知を再開します。

この設定以降に変更、追加されたフォルダとファイルは、検索インデックスとプレビューが自動的に更新されます。

画面下部のシステム設定 > 設定全般(config.ini) を開きます。

テキストボックスに、directory と入力します。

directory_change_notifier_disabled を選択し、OFFに設定します。

「保存する」ボタンを選択して、「今すぐ再起動する」を選択してサービス再起動を行うと反映されます。

 

インデックス再構築(2回目)の実行

ファイル変更検知を有効化した後に、もう一度インデックス再構築を実行します。

これにより、1回目のインデックス構築期間中にユーザーが変更したファイルを含め、完全な検索インデックスを構築することができます。

文書の更新日時をチェックして登録済みインデックスとの差分のみを更新するため、処理時間は初期構築とくらべて大幅に短縮されます。

再構築の操作は初回と同じです。