テキスト抽出エンジンIFilterの使用について

<< Click to Display Table of Contents >>

Navigation:  システム管理者リファレンス > 導入時の留意事項 > 検索インデックス設定 >

テキスト抽出エンジンIFilterの使用について

 

IFilter について

FileBlogは、検索インデックスのテキスト抽出に xdoc2txt または IFilter プログラムを使用しています。

標準のテキスト抽出エンジンは、xdoc2txt ですが、ファイル種類によっては Microsoft が提供する IFilter を用いることができます。

IFilter は、Microsoft が提供するテキスト抽出エンジンで、Word, Excel, PowerPointなどのファイルのテキスト抽出に向いていて、xdoc2txt に比べて高速に処理することができます。(当社テストにおいて)

Microsoft Outlookメッセージ形式ファイル(.msg)や、Microsoft Visio の全文検索を行う場合には、IFilter のインストールが必須です。

 

.msg用IFilterは2014年1月現在、下記のURLからダウンロードできます。

http://www.microsoft.com/en-us/download/details.aspx?id=1111

Visioフィルターを含む 「Microsoft Office 2010 フィルタパック」は2014年1月現在、下記のURLからダウンロードできます。

http://www.microsoft.com/ja-jp/download/details.aspx?id=17062

microsoftフィルタパックには、Microsoft Searchサービスが必要です。

 

使用方法

1.画面下部のシステム設定 > 高度な設定 > 検索・プレビュー > ファイル種類 を開きます。

0093

 

2.IFilter を使用するファイル種類を指定します。

標準では、Microsoft Office、Adobe PDF が、IFilter を使用するように設定されています。

0094

 

3.例として、Wordファイル(.doc)を IFilter 使用に指定します。

a.「全文検索対象」に、doc を指定します。

この項目に指定がないファイル種類は全文検索の対象になりません。

b.「IFilter 利用」に、doc を指定します。

この項目に指定がない場合、標準の xdoc2txt が使用されます。

対応する IFilter がインストールされていない場合も xdoc2txt が使用されます。

doc に対応するIFilter用のライブラリをインストールしてください。(doc については、Windowsに標準でインストールされています。)

4.「保存する」ボタンを選択して、インデクサーサービスを再起動していください。