テーマ:PDF

実験用のPDFを色々なPDF Viewerで見てみる

テスト用のPDFを作ってみた。 http://www7a.biglobe.ne.jp/~kzworks/attach/testboard.pdf フォントはRyumin-Lightで、埋め込みを解除してある。 これをAdobe Reader 8.1で表示するとこのようになる。 私のPCにRyumin-Lightはインスト…
トラックバック:0
コメント:0

続きを読むread more

PDF Viewer 4種の比較

取り急ぎ、Adobe Reader 7.09、SumatraPDF viewer、Foxit Reader、PDF XChange Viewerの動作を比べてみた。 といっても、今回は単に、フォントを埋め込まなかった場合、「Ryumin-Light」の指定でどのフォントが使われるかを見ただけだ。また、不適切な材料を使ってしまったため、…
トラックバック:1
コメント:0

続きを読むread more

GNUpdfというプロジェクトがある

WEBサーフィンの最中に http://gnupdf.org/ というページを見つけた。数あるGNUのプロジェクトの中でも、かなり重要度が高い部類にランクされているのだが、今日の今日までまったく気付いていなかった。 PDFファイルの閲覧、操作のためのオープン&フリーのライブラリおよびプログラムを作るのが目的なのだそうだ。ただし、まだ動…
トラックバック:1
コメント:0

続きを読むread more

PDF-XChange Viewerのライセンス文言に微妙な変化

「PDF-XChange Viewerを試せない理由」について 今日、PDF-XChange Viewerの最新版をダウンロードしてみたところ、ライセンスの文言が微妙に変わっているのに気付いた。ライセンスの問題さえクリアできていればと思ってふとダウンロードしただけだったのだが、あまりにどんぴしゃりな文言の変化だったので驚いた。 別の…
トラックバック:0
コメント:0

続きを読むread more

バイナリエディタでPDFのフォント関連を書き換える、その方法

普通にバイナリエディタでPDFを書き換えてしまうと、Adobe Readerで開く際にエラーが出るのではないかと、読者さんからコメントを頂いた。コメント欄を使ってお返事を書こうとしたけれど、長くなりそうなので、別途記事を一つ起こすことにした。PDFに細工するのに、Adobe Acrobatの機能で事足りない場合はこのテクニックがどうして…
トラックバック:0
コメント:0

続きを読むread more

バイナリエディタでPDFのフォント関連を書き換える際のメモ

本日の試行錯誤の結果をメモしておく。 「MS 明朝」のPDF内部名は「MS-Mincho」、「MS P明朝」の内部名は「MS-PMincho」。なので、Ryumin-Lightなどで作成したPDF(フォント埋め込まず)をバイナリエディタで開き、「Ryumin-Light」の文字をこれらで置き換えると、MS 明朝やMS P明朝で事実上強…
トラックバック:0
コメント:2

続きを読むread more

さらに「PDFを画像ファイルにするツール」発見

先日紹介した ImageMagick(ghostscript)、pdftools に続き、また新しいツールを発見した。Xpdfに付属の「pdftoppm.exe」。MS-Windows環境で使用する前提で探しているので、「.exe」がつく。 Xpdfみたいなメジャーなソフト(少なくとも、Unix系のツールを使う人なら知っているはず)に…
トラックバック:0
コメント:0

続きを読むread more

PDF関連でまた困ったツール発見

以前のバージョンの Sumatra PDF viewer には、印刷禁止のPDFが印刷できてしまう問題があるということを、かつてこのブログで報告した。印刷禁止のPDFといっても、実態は、単に「印刷しないでね」というデータがPDFファイルに含まれているというだけであって、それを真にうけて印刷しないか、そのようなものは無視して印刷できるよう…
トラックバック:1
コメント:0

続きを読むread more

Yet Another "PDFを画像ファイルにするツール"

Adobe Reader で PDF ファイルを開いて、必要な範囲をスナップショットツールで選択してクリップボードにコピーし、Windows付属のペイントに貼り付けて名前をつけて保存、などといちいちやってられないくらい、大量のPDFを処理しなければならないような場面が、時折ある。 このような場合、バッチ処理で便利なのが、ImageMa…
トラックバック:0
コメント:0

続きを読むread more

「Adobe Reader ではモリサワの基本○書体が特別扱い?」について

「Adobe Reader ではモリサワの基本○書体が特別扱い?」について 今日、何の気なしにPDFのチェックをしていたら、また、Adobe Readerの不思議な挙動を見つけた。Ryumin-Lightでフォントを埋め込まずに作成したPDFは、MS 明朝に置換表示されることは以前に調査した。Adobe Readerでプロパティを表示さ…
トラックバック:1
コメント:0

続きを読むread more

Sumatra PDF Viewer の新しいバージョンを試した

今年の1月1日付けで、Sumatra PDF Viewer の Ver 0.8 がリリースされていたのに、今日気付いた。早速ダウンロードしてみた。 Ver 0.7 で困らされていた、印刷時の微妙な版面のずれの問題が解消していたので、まず一安心。 ところが、手元のPDFで試したところ、しおりがうまく機能しない。しおりが表示されはす…
トラックバック:0
コメント:0

続きを読むread more

Acrobatの自動処理機能あれこれ

今日、今年の初出社。まだ年末年始のお休み期間だけど、会社に行かないと、Adobe Acrobatが使えないから。で、やりたいことは昨年と変わらずで、大量のPDFを効率よく処理したいという、その1点につきる。手作業が入るとそこでどうしてもミスが生じやすい。なので、たとえ件数の少ない処理でも工程が多いようだと機械処理にしたいのだ。テスト回数…
トラックバック:0
コメント:0

続きを読むread more

作り方の作り方を研究する

いや、今日、疲れてたのかもしれないけれど、本当に頭にきたことがあった。 外注先に、また、まとまった数のPDFの作成をお願いしたのだが、やはり品質が揃わない。あまりに頭にきたので(といいながらも冷静を装って)、口実を作って外注先の作業現場に直接顔を出してみた。 そうしたら、わざわざAdobeから取り寄せたSDKを使って、VBで専用アプ…
トラックバック:0
コメント:2

続きを読むread more

ツールがお嫁入り

業務委託先から丁寧な依頼を受けて悪い気はしなかったので、自作のツールをいくらか提供することになった。他者から請け負った業務でも使われると癪だなと一瞬思ったものの、そのような小さな考えではいつまでたっても仕事は楽にならないし、それでデバッグが進むならそれでもいいかということで、提供に踏み切ることになった。 提供したのは、PDFで使われて…
トラックバック:1
コメント:0

続きを読むread more

電子出版用のDRMシステム

会社にセールスの方がいらっしゃって、FlipBookというものを紹介してくださった。 こんな感じ。 http://www.ebooksystems.co.jp/index.html システム的には悪くはないが、KeyringPDFとくらべてどうだろうか。 KeyringPDFはベースがPDFなので、出版社としては、印刷用のデ…
トラックバック:0
コメント:0

続きを読むread more

PDFの暗号化にAESが使える

今日の今日まで知らなかった。OpenTypeフォントのことを調べていたら、PDFでAESでの暗号化が標準でサポートされていることを知った。ただし、Acrobat、Readerともに7.0以降での話だ。 世間的にはまだまだAdobe Reader 6.0以前を使っているユーザーはたくさんいるので、そうおいそれとAES暗号化したPDFを使…
トラックバック:0
コメント:4

続きを読むread more

OpenType フォントを埋め込んだPDFをAcrobat Reader 4.0で開いたら?

これが後日大事な話につながるので、一つ。DTPでは、現在、OpenTypeとよばれる種類のフォントが主流となってきている。Microsoft Windowsについてきている MS 明朝だとか MS ゴシックだとかいうフォントはTrueTypeフォントといわれるもので、OpenTypeとはシステム的に異なった種類のフォントだ。 だから、…
トラックバック:0
コメント:0

続きを読むread more

PDF内の文書情報XMLデータはXMPというらしい

何でもかんでもアルファベット3文字に略すのはどうかと思うが、とりあえず、名前が判明した。 PDF内に埋め込まれた文書情報。そのXMLでのファイル形式はXMPというらしい。 これで、Googleで仕様その他を検索することができる。 いや、実際は逆で、今日作ったPDFのファイルサイズが異様に大きかったので、中を見てみたらこのXML…
トラックバック:0
コメント:0

続きを読むread more

大量のPDFに文書情報を書き込む Acrobat不要

昨日、大量のPDFに文書情報を書き込む方法として、JavaScriptを使うという案を紹介した。今日ふと別の方法を思いついて試したところうまくいったので、そちらもメモしておく。 Acrobatで作成したPDFには「MetaData」というエントリがあって、そこに文書タイトルや作者名がXML形式で保存されている。Adobe Read…
トラックバック:0
コメント:0

続きを読むread more

大量のPDFに文書情報を書き込む方法

そんなもの、Acrobatのバッチ処理で簡単にできるだろうと、ちょっと詳しい人なら思うかも知れない。自分も今日までそう思っていた。しかし、今日の案件では、文書ごとに異なるタイトルを入れなければならなかった。 Acrobat 8.0 のメニューでは、全文書に同じタイトルを設定することしかできなさそうだ。 ならば、ということで、先日…
トラックバック:0
コメント:0

続きを読むread more

「正しくないPDFファイルの扱い」について、お恥ずかしい

「正しくないPDFファイルの扱い」について やってしまった。正しくないのは私のほうだった。 記事内容に大きな誤りが見つかった。 どうしようか考えた結果、とりあえず間違えた記事は削除せず、どこが間違いだったのかだけ分かるようにしておいた。後で訂正記事を書いたとしても、検索エンジンから飛んでくる人がそこまで読んでくれるとも限らないし。 …
トラックバック:0
コメント:2

続きを読むread more

正しくないPDFファイルの扱い

PDFは仕様が公開されているので、Acrobat以外にも作成ツールがたくさんある。それらの中には、正しくないPDFを作成してしまうものもある。が、Adobe Readerはそのあたり寛容で、多少間違いがあってもそ知らぬふりをして表示してしまう。そのようなPDFをデータとして扱おうとすると、いろいろと困った問題が出てくる。 今日もP…
トラックバック:1
コメント:0

続きを読むread more

Sumatra PDF viewer 7.0 の小さなバグ

Sumatra PDF viewer 7.0の印刷機能には小さなバグがある。 印刷面が少し右下にずれてしまうのだ。なので、ページ下部の文字が切れてしまったりする。 これはまあ、試してみれば分かるものだし、次のバージョンで修正されるだろうから、大した問題ではない。 問題なのは、というか、興味深いのは、このバグに関して、Sumat…
トラックバック:0
コメント:0

続きを読むread more

Perlを使った仕事の長所と短所

連日頭を痛めているPDFの問題、今日、pdftkでuncompressしてPerlで処理したら、仕事の段取りがどうなるかテストしてみた。 厳密なパーサを作っているわけではないということを念頭において、エラーメッセージの表示をやや多目にしておいたのだが、それは今日のところは意味を成さなかった。 今日のところ、Perlでの簡易パース…
トラックバック:0
コメント:0

続きを読むread more

もう一つ、PDF解析用のライブラリ

先日、mupdfを紹介したが、それ以外に、popplerというPDF解析用ライブラリもある。 sumatra pdfviewerでは、このpopplerとmupdfを切り替えて、どちらでも利用できるようになっている。 mupdfのほうが、動作速度が速いようだ。 mupdfがCで書かれているのに対して、popplerはC++で書…
トラックバック:0
コメント:0

続きを読むread more

PDF解析用のライブラリ

ふと思い出した。このブログでも何度かとりあげた軽量かつオープンソースのsumatrapdf viewerでも使われている mupdf という、pdf解析用のライブラリがある。 Cで書かれているので、私にはとっつきやすい。 これのソースと、PDF Referenceと、あと適当なPDFファイル一つ(pdftkでuncompressして…
トラックバック:0
コメント:0

続きを読むread more

pdftkのuncompress機能の挙動についての留意点

このブログで何度も紹介しているが、PDFファイルをコマンドラインで操作するのに便利なpdftkというツールがある。日本語のファイル名が扱えないという問題があるものの、PDFファイルを分割したり、パスワードをかけたりといった用途に結構便利に使える。 そういった便利機能の一つにuncompress機能がある。 普通の人はPDFファイルの…
トラックバック:0
コメント:0

続きを読むread more

ついに .NET に手を出すか?

PDFをいじくりまわすにあたって、pdftkというツールが便利だということは、以前のエントリでも紹介した(つもりでいる)。ただし、このpdftkは、日本語のファイル名を扱えないという問題がある。ソースをいじってどうにかしようとしたが、結局、gcjに原因があるようでどうしようもないまま投げ出して、今日に至っている。 別のライブラリがない…
トラックバック:0
コメント:0

続きを読むread more

PDF内のフォントを強引に置換する

OpenTypeフォントで作られてしまったPDFのデータを何とか、非OpenTypeのフォントに置換できないかと調べていたら、かなりよいヒントが見つかった。 http://www.eaflux.com/replacecjkfonts/ ここで配布されている、replacecjkfonts.pl というPerlスクリプト。 …
トラックバック:0
コメント:0

続きを読むread more