コンバーターの動作制限

テキスト抽出およびプレビュー作成に使用するコンバータープログラムは、使用できるメモリ容量および実行処理の動作時間に制限があります。

大容量ファイルや大きな用紙(A1等)から生成したデータに対する処理、OCR実行の処理では、コンバーターの動作制限により該当ファイルについては処理が途中停止して完了できないことがあります。

処理が完了できないと該当ファイルのテキスト抽出やプレビュー作成はできず、次回より処理がスキップ されるようになります。

メモリ使用容量

次のような症状が発生したらコンバーターのメモリ使用上限を超過しています。

  • プレビュー作成に失敗して次のようなエラーが出力される。

    The external process exceeded the working set size limit. (maxWorkingSet=1024MB) (programpath=Teppi.FileBlog.Converter.exe)
    
  • OCR機能を有効化した状態でPDF等のインデックス再構築後にテキスト抽出されない、または白紙のbodyu.txtが出力される。

メモリ使用上限を変更する

  1. [管理ツール > 設定全般 > クイックアクセス > メモリ上限]を選択します。

    ../../_images/20241112-165750-991.png
  2. [Converter/MaxWorkingSetSize]を選択します。

    ../../_images/20241112-165859-222.png
  3. 標準既定の拡張子*の設定を編集して[value]の値を変更すると、全てのファイル種類を対象とした変更になります。

    • [追加]を選択して[key]に拡張子、[value]に値を入力するとファイル種類別の変更になります。

  4. [保存する]を選択してサービスを再起動します。

変更の注意点

  • マシンに実装されているメモリ容量を超える値を登録しないでください。

  • メモリ容量の少ないマシンでは値を大きくすると、処理中にマシンやシステムが不安定になる可能性があります。

  • 処理結果を確認しながら段階的に上げていくことをおすすめします。

テキスト抽出のタイムアウト

  • ファイルのプロパティに次のように表示されると処理時間が超過(タイムアウト)している可能性があります。

    ../../_images/20250114-140334-667.png
  • ログ(idxsvr.log)またはプレビュー保存フォルダに次のように出力されていると超過(タイムアウト)しています。

    • プレビュー保存フォルダの当該ファイルに紐づくフォルダにbodyerror.txtファイルが出力されます。

lv:WARN	msg:failed to filter text. (message=The external process exceeded the timeout limit. (timeout=00:01:00)

テキスト抽出の制限時間を変更する

  1. [管理ツール > 設定全般 > timeout]で検索します。

    ../../_images/20250114-140315-695.png
  2. [Converter/FilterTextTimeout]を選択します。

  3. 標準既定の編集ダイアログを開いて時間を指定します。

    • ファイル種類別に指定する場合は[追加]を選択して拡張子を指定します。

    ../../_images/20250114-140740-350.png
  4. 設定を保存してサービスを再起動します。

プレビュー作成のタイムアウト

次のような症状が発生したら処理時間が超過(タイムアウト)しています。

  • プレビュー作成に失敗して次のようなエラーが出力される。

プレビュー抽出処理にタイムアウトしました。
---
The external process exceeded the timeout limit. (timeout=00:01:00) 

プレビュー作成の制限時間を変更する

  1. [管理ツール > 設定全般 > timeout]で検索します。

    ../../_images/20250114-140521-426.png
  2. [Converter/CreatePreviewTimeout]を選択します。

  3. 標準既定の編集ダイアログを開いて時間を指定します。

    • ファイル種類別に指定する場合は[追加]を選択して拡張子を指定します。

    ../../_images/20250114-140657-043.png
  4. 設定を保存してサービスを再起動します。

変更後のインデックス再構築について

テキスト抽出・プレビュー作成に失敗したファイルは次回の処理がスキップされるようになります。

スキップされないようにするには、処理の再実行前にプレビュー保存フォルダに作成されたファイルの削除が必要です。

  • テキスト抽出の失敗時:bodyu.txtまたはbodyerror.txtを削除します。

  • プレビュー作成失敗時:error.txtを削除します。

  • コマンドラインツールでファイルを指定して一括削除することもできます。