コンバーターの動作制限
テキスト抽出およびプレビュー作成に使用するコンバータープログラムは、使用できるメモリ容量および実行処理の動作時間に制限があります。
大容量ファイルや大きな用紙(A1等)から生成したデータに対する処理、OCR実行の処理では、コンバーターの動作制限により該当ファイルについては処理が途中停止して完了できないことがあります。
処理が完了できないと該当ファイルのテキスト抽出やプレビュー作成はできず、次回より処理がスキップ されるようになります。
メモリ使用容量
次のような症状が発生したらコンバーターのメモリ使用上限を超過しています。
プレビュー作成に失敗して次のようなエラーが出力される。
The external process exceeded the working set size limit. (maxWorkingSet=1024MB) (programpath=Teppi.FileBlog.Converter.exe)
OCR機能を有効化した状態でPDF等のインデックス再構築後にテキスト抽出されない、または白紙のbodyu.txtが出力される。
メモリ使用上限を変更する
変更の注意点
マシンに実装されているメモリ容量を超える値を登録しないでください。
メモリ容量の少ないマシンでは値を大きくすると、処理中にマシンやシステムが不安定になる可能性があります。
処理結果を確認しながら段階的に上げていくことをおすすめします。
テキスト抽出のタイムアウト
ファイルのプロパティに次のように表示されると処理時間が超過(タイムアウト)している可能性があります。
ログ(idxsvr.log)またはプレビュー保存フォルダに次のように出力されていると超過(タイムアウト)しています。
プレビュー保存フォルダの当該ファイルに紐づくフォルダに
bodyerror.txt
ファイルが出力されます。
lv:WARN msg:failed to filter text. (message=The external process exceeded the timeout limit. (timeout=00:01:00)
テキスト抽出の制限時間を変更する
プレビュー作成のタイムアウト
次のような症状が発生したら処理時間が超過(タイムアウト)しています。
プレビュー作成に失敗して次のようなエラーが出力される。
プレビュー抽出処理にタイムアウトしました。
---
The external process exceeded the timeout limit. (timeout=00:01:00)
プレビュー作成の制限時間を変更する
変更後のインデックス再構築について
テキスト抽出・プレビュー作成に失敗したファイルは次回の処理がスキップされるようになります。
スキップされないようにするには、処理の再実行前にプレビュー保存フォルダに作成されたファイルの削除が必要です。
テキスト抽出の失敗時:
bodyu.txt
またはbodyerror.txt
を削除します。プレビュー作成失敗時:
error.txt
を削除します。コマンドラインツールでファイルを指定して一括削除することもできます。