テキスト抽出エンジンIFilterの使用について

トップ  前へ  次へ

 

IFilterについて

 

FileBlog では全文検索用のテキスト抽出に xdoc2txt または IFilter を使用しています。

 

FileBlog の標準のテキスト抽出エンジンは xdoc2txt.exe ですが、ファイル種類によっては、Microsoft が提供する IFilter を用いることができます。

IFilter は、Microsoft が提供するテキスト抽出エンジンで、Word, Exel, PowerPoint などのファイルのテキスト抽出は xdoc2txt に比べて高速に処理することが可能です。(当社テストにおいて)

※Microsoft Outlookメッセージ形式ファイル( .msg )や Microsoft Visio の全文検索を行う場合は IFilterのインストールが必須になります。

.msg 用 IFilter は2012年10月現在、下記のURLからダウンロードできます。

       http://www.microsoft.com/en-us/download/details.aspx?id=1111
 

Visio フィルターを含む 「microsoft Office 2010 フィルタパック」は2012年10月現在、下記のURLからダウンロードできます。

       http://www.microsoft.com/ja-jp/download/details.aspx?id=17062

       ※microsoft フィルタパックには、Microsoft Search サービスが必要です。

 

 

使用方法

 

IFilter で抽出させたいファイルの種類を、例として仮に "doc" とします。(最新版を新規インストールすると既定では MS Office,  Adobe PDF は IFilter を使用するように設定されています。)

 

管理ツールを開いて、環境設定 > 設定 > 簡易モード > ファイル種類 を開きます。

 

clip0077

 

まずファイル種類の[全文検索対象]に doc を指定してください。この項目に指定がないと、そのファイル種類についてテキスト抽出が行われません。

 

次にファイル種類の[IFilter利用]に doc を指定して下さい。この項目に指定がない場合、xdoc2txt.exe が使用されます。また、対応する IFilter がインストールされていない場合も xdoc2txt.exe が使用されます。

 

doc に対応する IFilter 用のライブラリをダウンロード&インストールして下さい。(doc については、通常 Windows に標準でインストールされています)

 

Fb3Indexer サービスを再起動します。

 

 

 

 


Copyright © 2014 Teppi Technology Co. Ltd. All rights reserved.