コンバーターのメモリ使用容量

テキスト抽出・プレビュー作成に使用するコンバータープログラムは、使用できるメモリ容量が制限されています。

大容量ファイルや大きな用紙(A1等)から生成したデータに対する処理、OCR実行の処理ではコンバーターが使用するメモリ容量が大きくなります。

処理においてメモリ使用の上限を超過してしまうと、当該ファイルのテキスト抽出やプレビュー作成はできません。

メモリ使用容量の上限超過

次のような症状が発生したら上限を超過しています。

  • プレビュー作成に失敗して次のようなエラーが出力される。

    The external process exceeded the working set size limit. (maxWorkingSet=1024MB) (programpath=Teppi.FileBlog.Converter.exe)
    
  • OCR機能を有効化した状態でPDF等のインデックス再構築後にテキスト抽出されない、または白紙のbodyu.txtが出力される。

メモリ使用容量の上限を変更する

  1. [管理ツール > 設定全般 > すべての設定 > 全文テキスト/プレビュー抽出]を選択します。

  2. [MaxWorkingSetSize]を選択します。

  3. 標準既定の拡張子*の設定を編集して[value]の値を変更すると、全てのファイル種類を対象とした変更になります。

  4. [追加]を選択して[key]に拡張子、[value]に値を入力するとファイル種類別の変更になります。

  5. [保存する]を選択してサービスを再起動します。

../../_images/20240718-163820-805.png

変更の注意点

  • マシンに実装されているメモリ容量を超える値を登録しないでください。

  • メモリ容量の少ないマシンでは値を大きくすると、処理中にマシンやシステムが不安定になる可能性があります。

  • 処理結果を確認しながら段階的に上げていくことをおすすめします。

変更後のインデックス再構築について

テキスト抽出・プレビュー作成に失敗したファイルは次回の処理がスキップされるようになります。

スキップされないようにするには、処理の再実行前にプレビュー保存フォルダに作成されたファイルの削除が必要です。

  • テキスト抽出の失敗時:bodyu.txtまたはbodyerror.txtを削除します。

  • プレビュー作成失敗時:error.txtを削除します。

  • コマンドラインツールでファイルを指定して一括削除することもできます。