2012年6月16日土曜日

Acrobat 9 Standardでマスキング(墨消し)する方法

今日は某ボランティア団体の会報のバックナンバーをネットで公開するため、スキャンしたファイルと格闘中です。

昔(約20年前)の会報だと役員名簿などが含まれていたりして、個人情報に配慮されていなかったりします。なので、マスキング(墨消し)作業が必須になります。

ところが、ScanSnap S1500に付属のAdobe Acrobat 9 StandardにはPDFファイルの墨消し機能が無いらしいです。(以下のサイト参照)

PDFのマスキング(墨消し)

> 墨消ししたいところはイメージデータで消して再作成する
> くらいしか無いかと思います。


なので、少々手間がかかるけど墨消しする方法をメモしておきます。

おおざっぱな流れとして、、、

1.PDFファイルの中の墨消ししたい部分を長方形ツールなどで隠す。
2.PDFファイルをページ単位にJPEGなどの画像ファイルに分割する。
3.画像ファイルを結合して再度PDFファイルにする。
4.OCRテキスト認識をかける。

こんな感じになります。(ちなみに4はオプションです。透明テキスト付きPDFにしたい方は実行してください。)

細かい手順は省略しますが、操作自体はそれほど難しくないです。

難点は、ファイルサイズが大きくなることです。ScanSnapでスキャンしたPDFファイルの2~5倍ぐらいになりました。まあ、2MBが10MBになってもファイル数がそれほど多くないので、それほど気にはならないです。

ScanSnap Organizer の Runtime エラー対処方法

ScanSnap S1500を使っていたら、ある日突然Visual C++のランタイムエラーが出て、いろいろ試行錯誤した結果をまとめておきます。


1.動作環境
Lenovo ThinkPad T520(Windows7 64bit)


2.エラーの状況

ScanSnap Organizerを起動し、「検索可能なPDFに変換」→「対象ファイル一覧(T)」を表示させようとしたら、以下のエラーメッセージが出力される。

「PfuSsOrgOcrListは動作を停止しました」

で、このエラーメッセージが出た後に、Visual C++のエラーが出ます。
ウィンドウ名が「Microsort Visual C++ Runtime Library」
中のメッセージが「Runtime Error! (以下略)」


3.ヒントになったサイト


> ScanSnapシリーズ総合スレ Part23
> http://read2ch.com/r/printer/1321272446/
> No.729
> > ScanSnap Organizer で「Runtime Error!」が発生すること
> > につきましては、検索可能なPDFの対象ファイル一覧に
> > なんらかの不具合が発生しているために、今回のエラーが
> > 表示されている可能性がございます。

どうやらどこかのキャッシュファイルが悪さをしているようです。

確かに、「対象ファイル一覧」のウィンドウの中に「検索可能なPDF一覧」が残っていて、このファイルの文字列をテキスト変換できなくてエラーが出ているようです。なので、一覧からファイルの表示を消せばいいのですが、画面を操作する前にエラーで落ちてしまうので、キャッシュファイルを探すことにしました。


4.対処方法

以下のフォルダへ移動。(PCによっては別のフォルダになるかもしれません。)
C:\Users\[ユーザ名]\AppData\Roaming\PFU\ScanSnap Organizer

以下のファイルを削除して対応しました。
(実際の所、いきなり削除は怖いので、ファイル名を変えて試してみました。)
ExtAppsOrderSetting.ini
PfuSsOrgOcr.ini


以上、同じようなエラーが出て困っている方のお役に立てれば幸いです。