2014年1月21日火曜日

MacのプレビューでPDFの透明テキストが失われる

PDFを快適に読むにはどうすればいいか。単に読むだけなら、たとえばiPadのi文庫HDで読むのはとても気持ちいい。では、ラインを引いたりメモを書きこんだりしつつ読みたいときはどうすればいいか。

試した中でいちばん快感を覚えたのは、MacBook Airで、Mac OSの「プレビュー」で読む方法だった。インターフェイスがすっきりしている。アイコン等が目障りだとイヤなのだ。余分なソフトをインストールしなくていいし、操作にも慣れているし、速度もまあまあ。

この機能は、Mac OSがLionのときから愛用していた。難しい本は読む前にバラして、ScanSnapでスキャンして、AcrobatでOCRをかけて透明テキストを埋めこむ。OCRをかけるのは、テキスト抽出のためでも検索のためでもなくて、ただハイライトやアンダーラインなどの注釈をつけやすくするためだ。

OSをLionからMavericksにバージョンアップすると、プレビューのPDF編集機能も改善されていた。感心したのはこの、微妙に波打った蛍光ペンの表現。単にハイライトなのか、それとも画像かなんか乗せてるのだろうか。
リアルの本に蛍光ペンを長々と引くのはなんだかためらわれる。インクで紙が波打ったりするし、塗りまちがったら汚くなる。電子媒体ならそれがないし、なにより、塗った後で消したり色を変えたりできる。「塗ったあとで色を変えられる」、なんてすごいことだ。昔の人が聞いたらびっくりだ。そこには蛍光ペンのイデアだけがあるのだ。

PCで書きこみをするなんて、まどろっこしい、と思っていた。ところが、意外なことに紙より速いのだ。紙を読んでいるとき、書きこみにかかる時間を、試しに計ってみた。すると、単語の囲みや一行のアンダーラインには5秒、複数行の囲みやアンダーラインは10秒。メモを書きこむには1文字あたり1秒かかっていることがわかった。

PDFへの書きこみは、単語や一行だと同じくらいだが、複数行やメモだと紙よりもずいぶん速い。上記画像で、手でハイライトをつけるなら三行ぶん手を動かさねばならない。しかしPDFなら青の矢印のぶんだけカーソルを動かせばいい。そして、書きこみの見やすさや再利用性は圧倒的にPDFのほうが優れている。だから紙の本をわざわざスキャンしてでもPDFにするのだ。

…と、ここまでは読書電子化極楽話なのだけど、困ったことがおきた。

Mavericks(10.9.1)のプレビューで、透明テキストつきのPDFを編集して保存すると、透明テキストが全部失われてしまうようだ。しかも、手動で保存しなくても、編集した時点で自動保存されるので、何か編集を開始したら、透明テキストもろとも注釈は失われ、二度と返ってこない。It's gone in the air. You can never capture it again. なお、編集しなくても「複製」だけでも同じ現象が起こるようだ。

PDF自体は、また自炊すれば手に入る。しかし注釈は、再現不可能な個人オリジナルの情報だ。それが強制上書で消えてなくなるのは怖ろしい。その症状と、その恐怖は、この「自動保存でフォトショップのレイヤーが統合される」件に似ている(→【重要な問題!!】Mac OSX 10.7 Lionのプレビューは危険!?

Lionのときはこんなことはなかったと思うのでMavericksのバグかなあ。ネットで調べても情報がみつからないので、とりあえず書いてみました。また新しい読み方を探さないと。

2015/7/17 追記:10.10.4 で直ったかも

1 件のコメント:

  1. Yosemiteでも同じ症状で悩まされています。辞書.appが秀逸なので、プレビューを使いたいのですが、この問題があって使えません。Acrobatはなんで辞書.appに対応していないのでしょう。

    返信削除