インデックス構築

トップ  前へ  次へ

 

【このページの主な項目】

 

検索インデックス・プレビューの初期構築
初回インデックス構築状況の確認
ファイル変更監視の再開
インデックス再構築(2回目)の実行

 

検索インデックス・プレビューの初期構築

 

導入当初、まず全文書を検索エンジンに登録する必要があります。また、あらかじめサムネイルやプレビュー画像を作成しておくと、ユーザーがフォルダやファイルを開いた時に即座にファイルの閲覧ができるようになります。

この検索インデックスおよびプレビューの初期構築には、文書量やサーバー性能にもよりますが長時間を要することがあります。

できるだけ短時間に初期構築を終わらせるために、インデックスの初期構築期間をスケジュールし、その期間はユーザーにFileBlogシステムの利用を公開せず、通常運用時と異なるシステム設定を行って、検索サーバーを初期構築に専念させてください。

 

 

ファイル変更検知を一時停止

FileBlogは、ドキュメントルートフォルダの変更をリアルタイムで監視し、変更を検知すると検索インデックスを更新します。

一般に、FileBlogのインデックス初期構築期間中も、ユーザーはファイルサーバーを利用すると考えられ、ファイルの変更が頻繁に行われる可能性があります。

FileBlogの通常運用時は、検出された変更内容の処理を随時行うため、インデックスの初期構築・プレビューの初期作成が滞るおそれがあります。

 

ユーザーによるファイル変更が頻繁に発生する環境でのインデックス初期構築の場合には、下記手順でファイル変更監視を一時停止することで、処理時間の短縮が可能になります。(必須ではありません)

 

管理ツール > 高度な設定 > その他全設定項目(config.ini) を開きます。
directory_change_notifier_disabled を、ONに設定します。
サービスを再起動すると、すべてのドキュメントルートに対して、ファイル変更検知が無効になります。

 

 

インデックス構築(初回)の実行

FileBlogにログインして、「システム設定」のメンテナンス操作「インデックスの再構築」をクリックしてください。
すべてのドキュメントルートを対象に、インデックス再構築を行います。

 「検索インデックス再構築」「プレビュー抽出を行う」の両方をチェックしてください。

実行を押すと、インデックス構築が始まります。

 

 

初回インデックス構築状況の確認

 

初回インデックス構築は下記のように進行していきます。

「システム設定」から稼動状況の確認の「インデックス構築状況」で状況を確認できます。

 

フォルダスキャン

ドキュメントルート以下の全ファイルをスキャンして、ファイル一覧を作成します。このジョブは単純にスキャンするだけなので、非常に高速に処理が完了します。スキャンが完了すると、文書数の項目に、ドキュメントルートごとのファイルカウント数が表示されます。

 

0034

 

 

検索インデックス構築

フォルダスキャンが終わると、テキスト抽出および、検索インデックス登録処理がスタートします。この処理では、各ファイルを読み取ってテキストを抽出し、抽出したテキストを検索エンジンに登録します。

 

ファイル数が10万件以上ある場合には、数時間~数十時間を要することがあります。

パフォーマンスチューニング・パラメータを適切に設定することによって、処理時間を大幅に短縮できる可能性があります。

 

0035

 

※検索インデックス構築、プレビュー抽出処理の進捗状況は、処理中のステータスで確認できます。検索インデックス登録の残件数は、テキスト抽出した後にキューに登録されるので、一様に減っていくわけではありません。

 

検索可能件数が増えない?

処理が始まっているのに、検索可能件数はなかなか増えないように見えます。これは、検索エンジンが変更をメモリにキャッシュしていて、ディスクへの書き込みは2000ファイルに1回のタイミングで遅延して行われるためで、心配ありません。

 

待ちきれない場合は?

インデックス構築処理の実行途中でも、インデクサー(Fb3Indexer)サービスを停止することができます。Fb3Indexerを再び起動すると、中断した地点からインデックス構築処理を自動的に再開します。処理の途中でいったん中断して、パフォーマンス・チューニング・パラメータを変更したりすることができます。

また、サーバーを再起動した場合も、中断した地点からインデックス構築処理を自動的に再開します。

 

サーバーのコンソールがフリーズして困ったら

インデックスの初期構築は、大変負荷の重い処理です。そのため、検索サーバーが「バックグラウンドタスク優先」に構成された環境だと、インデックス構築処理によってCPUが100%近く占有された場合に、マウスカーソルが動かなくなったり、キーボード入力が受け付けられなくなったりすることがあります。このような症状を予防するために、以下を心がけてください。

 

FileBlogにログインするためのWebブラウザは、サーバーマシンとは別の端末PCから行う方が安全です。
サーバーのコンソール上では、なるべく無駄にアプリケーションを起動しないようにしてください。

 

万が一、コンソールが入力を受付けなくなった場合には、リモートマシンからサーバー上で稼動する、インデクサー(Fb3Indexer)サービスを停止することで、サーバーを落ち着かせることができます。

 

コマンドプロンプトから下記のコマンドをご利用下さい。

> sc \\ServerName stop Fb3Indexer

 

上記の「sc」コマンドで、サーバー「ServerName」上のFb3Indexerサービスに停止要求を投げることができます。ServerNameの部分は実際のコンピューター名に合わせてください。

 

停止要求が受付けられたかどうかは下記コマンドで確認できます。

> sc \\ServerName query Fb3Indexer

 

STATUS: RUNNINGならば、停止要求を未だ受付けていません。STOP_PENDINGならば、停止中。STOPPEDは停止状態です。

 

プレビュー抽出

プレビュー抽出処理は、負荷の大きな処理ですので、特に初回構築時には長時間を要します。

 

 

ファイル変更検知の再開

 

プレビュー作成まで完了したら、ファイルのリアルタイム変更監視を再開します。

 

管理ツール > 高度な設定 > その他全設定項目(config.ini) を開きます。
directory_change_notifier_disabled を、OFFに設定します。
サービスを再起動すると、すべてのドキュメントルートに対して、ファイル変更検知が有効になります。
これ以降に変更、追加されたファイルについては、検索インデックスとプレビューが自動的に更新されます。

 

 

インデックス再構築(2回目)の実行

 

ファイル変更検知を有効化した後に、もう一度インデックス再構築を実行します。

これにより、一回目のインデックス構築期間中にユーザーが変更したファイルを含めた、完全な検索インデックスを構築することができます。

再構築の操作は初回と同様です。

 

FileBlogにログインして、ステム設定からメンテナンス操作の、インデックス再構築を開いてください。
すべてのドキュメントルートを対象に、インデックス再構築を行います。

 「検索インデックス登録を行う」「プレビュー抽出を行う」の両方をチェックしてください。

実行を押すと、インデックス構築が始まります。

 

 


Copyright © 2016 Teppi Technology Co. Ltd. All rights reserved.