民芸的プログラミング 〜ソフトウェア開発日記〜

アクセスカウンタ

zoom RSS PDF関連でまた困ったツール発見

<<   作成日時 : 2008/01/17 23:58   >>

ブログ気持玉 0 / トラックバック 1 / コメント 0

以前のバージョンの Sumatra PDF viewer には、印刷禁止のPDFが印刷できてしまう問題があるということを、かつてこのブログで報告した。印刷禁止のPDFといっても、実態は、単に「印刷しないでね」というデータがPDFファイルに含まれているというだけであって、それを真にうけて印刷しないか、そのようなものは無視して印刷できるようにしてしまうかは、ビューワの開発者が決めることなので、「絶対印刷できない」わけではないのだ。「印刷してほしくない」という意思表示レベルのものだという認識のもとで、そういったPDFは作成する必要がある。

で、今日見つけてしまったのは、テキストデータ抽出を禁止してあるPDFからテキストデータを抽出できてしまうツールだ。
世の中にはこんなツールもあるから「テキストデータ抽出禁止」のPDFを作成する際は注意しないといけないよ、という趣旨で、そのツールを紹介してしまおうかとも思いはした。が、実際は、Google検索などで、「テキストデータ抽出禁止のPDFからテキストを抽出するツール」を探してこの記事にたどり着く人のほうが多いのだろうと思い、どのツールであるかまでは明記しないことにした。
pdftkやpdftotextなど、有名どころのツールでは、このようなことができないように、きっちりと内部で制御されているのだが、ちょっとマイナーなツールになると、お約束違反ができてしまうので、PDFを作成する人は、よほど注意をする必要がある。本当にテキスト抽出されたくないのであれば、PDFの「テキスト抽出禁止」ではなく、サードパーティ製のもうちょっと凝ったプロテクトツールを使わなければならない。
...しかし、世の中、どうしてテキスト抽出を禁止するのかよくわからない文書がテキスト抽出禁止になっていたりするから困ったものだ。

テーマ

関連テーマ 一覧


月別リンク

ブログ気持玉

クリックして気持ちを伝えよう!
ログインしてクリックすれば、自分のブログへのリンクが付きます。
→ログインへ

トラックバック(1件)

タイトル (本文) ブログ名/日時
[DTP][PDF]セキュリティの機能も過信するなってことだな
まぁオープンなデータになっている以上、どうしてもこういう問題は発生するということで。 世の官公庁さんに行っている印刷会社さんの営業さんは、ゆめゆめ「PDF、ばっちりセキュリティの機能使っているから絶対オッケーっすよ!」とか言わないで欲しいものだ。「絶対」はソ ...続きを見る
DTP+印刷営業メモ
2008/01/20 20:25

トラックバック用URL help


自分のブログにトラックバック記事作成(会員用) help

タイトル
本 文

コメント(0件)

内 容 ニックネーム/日時

コメントする help

ニックネーム
本 文
PDF関連でまた困ったツール発見 民芸的プログラミング 〜ソフトウェア開発日記〜/BIGLOBEウェブリブログ
文字サイズ:       閉じる