テーマ:PDF

Mac OS X で作成したPDFからテキスト抽出ができない件

知人からPDFファイルが送られてきた。 加工するためにテキストデータを抽出しようとしたのだが、意味不明な文字列が出てくるばかり。 たとえばこんな感じ。«¬­®¯ これは、PDF上のテキストを選択して、このブログの投稿画面にペーストしたもの。 ちなみに元の文字列はまっかちん Adobe R…
トラックバック:0
コメント:6

続きを読むread more

Kindle で日本語PDFを表示しようとすると

Twitter 経由の情報。 Dan Kogai 氏が、Amazon Kindle で日本語が表示できるかどうかテストしてくれたようだ。 当初、情報の錯綜があったものの、結局のところ、フォントを埋め込んだPDFなら日本語の表示はOK。 そして、埋め込みが無い場合は今度こそ確認。フォント埋め込みはやはり必要。そうでないドキュメントを…
トラックバック:0
コメント:0

続きを読むread more

Sumatra PDF viewer がいつのまにか、Version 1.0 に

そろそろ新しいバージョンでも出ているかなと思い、Sumatra PDF viewer の公式サイトを見に行った。 http://blog.kowalczyk.info/software/sumatrapdf/index.html すると、いつの間にか、Sumatra PDF viewer が記念すべき Version 1.0 になっ…
トラックバック:0
コメント:0

続きを読むread more

TrueType Font の仕様書

TrueType フォントの仕様について、信頼に足るソース。 見つかる時は簡単に見つかるのだが、本当に欲しいときにかぎって、Google で検索しても、Yahoo で検索しても、ノイズにまぎれてなかなか見つからなかったりする。 なので、ここにメモしておく。 http://www.microsoft.com/typography/S…
トラックバック:1
コメント:2

続きを読むread more

Sumatra PDF viewer の最新バージョン

うっかり見落としていたが、7月19日に、Sumatra PDF viewer の新バージョンが公開されていたようだ。 http://blog.kowalczyk.info/software/sumatrapdf/news.html といっても、Sumatra PDF viewer は既に一つの完成域に達しているのだから、これ以…
トラックバック:0
コメント:0

続きを読むread more

OpenOffice.org の PDF 編集機能について、さらに

ひとつ、大事なことを書き忘れていた。 この PDF 編集用の拡張機能を入れたことで、特に OpenOffice.org 自体の動作が不安定になるようなところは見られなかった。 動作が重たくなることもない。 しかし。 PDF を開くという、このメインの機能に限っては、めちゃめちゃに遅い。 壊滅的な遅さ。 Adobe Rea…
トラックバック:0
コメント:0

続きを読むread more

OpenOffice.org の PDF 編集機能続報

先日、OpenOffice.org Draw の PDF 編集機能を使ってみたところ、日本語が文字化けしてしまって読めなかったという記事を書いた。 もしかしたら、PDF を選べばどうにかなるかな? と思って、フォントをまったく埋め込んでいない PDF ファイルを用意して実験したところ、興味深い結果が出た。 えー。 文字が全部消…
トラックバック:0
コメント:0

続きを読むread more

クセロ PDF 終了のお知らせ

株式会社クセロが無償で配布しており、そこそこ性能も良かったクセロ PDF の配布が間もなく終了する。 http://www.antenna.co.jp/news/XeloZERO-20090615.html アンテナハウスって、ああいう考え方の会社なので、そこに事業譲渡された時点で遅かれ早かれこうなることは見えていたことだ。 …
トラックバック:0
コメント:0

続きを読むread more

Sumatra PDF viewer で縦書きPDFに挑戦

縦書きの PDF がようやく手に入った。 それで、Sumatra PDF viewer でどう表示されるのか、見てみた。 その結果、縦書きには対応されていないことが分かった。 日本語の場合、縦書き表示の際に、 ー「」() といった記号類は90度回転させる必要がある。 また、「。」や「、」も位置を右上にずらしてやらなくては…
トラックバック:0
コメント:0

続きを読むread more

フリーなPDF Reader のキャンペーン

Slashdot Japan 経由で知ったのだが、FSF ヨーロッパが、「Free PDF Readers キャンペーン」というのを始めたらしい。 そして、PDFreaders.org というウェブサイトまで立ち上げている。 私も知らなかった フリーの PDFreader が一覧できて面白い。 Windows 上で動くもの…
トラックバック:0
コメント:0

続きを読むread more

Sumatra PDF viewer 0.9.3 が出ている

実はこのバージョン、リリース直後に気付いていたのだけれど、思うところがあって、紹介しようかどうか踏ん切りがつかなかった。 けど、いつまでも黙っていても仕方が無いので。 http://blog.kowalczyk.info/software/sumatrapdf/ 実は、「野良犬日記」の中の人の尽力があって、私がちまちまと書…
トラックバック:0
コメント:3

続きを読むread more

FSF の高優先プロジェクトから GNUpdf が漏れているような

先日、Free Software Foundation の高優先ソフトウェアプロジェクトの一覧が発表された。 何度も読み返したのだが、そこに GNUpdf がリストアップされていない。 どうしたことかとGNUpdf のホームページを見てみると、いつのまにか小さく衣替えしていた。確か、「GNUpdf は FSF が最も力を入れてい…
トラックバック:0
コメント:0

続きを読むread more

GnuPDF と SumatraPDF

Sumatra PDF viewer のホームページ上のフォーラムで、開発者の Krzysztof Kowalczyk さんを Gnu PDF プロジェクトに勧誘している人がいた。 Krzysztof Kowalczyk さんの答えは 1. そんな時間はない。 2. Gnu PDF プロジェクトは時間の無駄だ。す…
トラックバック:0
コメント:0

続きを読むread more

日本語対応 Sumatra PDF viewer v0.9.1 出来

今朝、Sumatra PDF viewer 0.9.1 に気付いて、驚いてしまった。取り急ぎソースをダウンロードして中身を調べたところ、それほど 0.9 と変わっていないようだったので、以前のパッチを手動で注意深く適用してみた。 すると、それで日本語対応ができてしまった。 日本語対応 Sumatra PDF viewer 0.9…
トラックバック:1
コメント:0

続きを読むread more

Sumatra PDF viewer の新バージョン v 0.9.1 が出ていた

つい先日、v 0.9 の日本語対応をして安心していたばかりだったのに、もう次のバージョンが出ていた。 Sumatra PDF viewer は半年に一度くらいしかバージョンアップしないと勝手に思い込んでいただけに驚いた。 さっそくダウンロードして、試してみた。やはりフォントの埋め込まれていない日本語PDFは化けた。また、一番目の…
トラックバック:0
コメント:0

続きを読むread more

「Sumatra PDF viewer 0.9 で日本語表示ができるように改造」について

「Sumatra PDF viewer 0.9 で日本語表示ができるように改造」について 申し訳ない。記事に大きな誤りが見つかった。 Sumatra PDF viwer 0.9 で日本語の検索がうまくいかないと書いてしまったが、これは私の大きな勘違いだった。 日本語の検索はできる。間違いなくできる。実際にできた。 検索用…
トラックバック:0
コメント:0

続きを読むread more

Sumatra PDF viewer 0.9 で日本語表示ができるように改造

先日公開された Sumatra PDF viewer 0.9 は残念なことにオリジナルのままでは、フォントの埋め込まれていない日本語 PDF ファイルで文字化けすることがある。 GnuPDF プロジェクトの成果物がなかなか出来てこない今、フリーでオープンソースの PDF Viewer として Sumatra PDF viewer は貴…
トラックバック:1
コメント:0

続きを読むread more

Sumatra PDF viewer 9.0 の日本語対応状況を確認

Sumatra PDF viewer 9.0 では、フォントを埋め込んでいない日本語PDFファイルをうまく表示できないということは、以前の記事でも紹介した。どうすればこの問題が解決するのか、少し調査をしてみたので報告。 結論から言うと、対処方法が今のところわからない。 これまでのバージョンのように、環境変数のCMAPDIRをセッ…
トラックバック:0
コメント:0

続きを読むread more

Sumatra PDF viewer 0.9 がリリースされている

Sumtra PDF viewer の新バージョンがリリースされていた。 http://blog.kowalczyk.info/software/sumatrapdf/index.html 以前のバージョンでは、PDFのしおり機能への対応が中途半端だった。しおりが表示はされるのだが、クリックしても反応しなかった。それが、このバー…
トラックバック:0
コメント:0

続きを読むread more

その名は GNU Juggler

久しぶりに GnuPDF プロジェクトのページ(http://gnupdf.org/)を見てみたら、進捗があったようだ。 GNU Juggler というソフトウェアが紹介されている。これは PDF Viewer 兼 Editor で、GNU PDF Library を採用した本格的なアプリケーションだ。とのこと。 で、肝心のプロジェク…
トラックバック:0
コメント:0

続きを読むread more

SumatraPDF Viewer を自力で日本語対応させる

SumatraPDF Viewer は作者のサイトからダウンロードしたそのままでも、日本語化されたメニューをオプションで表示することができる。また、フォントが埋め込まれていれば日本語の含まれたPDFの表示も可能だ。が逆に、PDFにフォントが埋め込まれていなければ日本語を表示することができない。たとえ日本語Windows上であってもだ。そ…
トラックバック:0
コメント:0

続きを読むread more

SumatraPDF Viewer 0.8.1 は一つのゴールに達したか?

一月ほど前に、SumatraPDF Viewer の最新バージョン、0.8.1が公開されていたのには気付いていたのだが、試す機会がなかなかなかった。今日、ちょっとした空き時間にこれを試したので簡単にレポート。 相変わらず動作は軽快。しおりをクリックしてもそこに飛ばないというお茶目なバグは0.8の頃のまま。ただし、印刷の際になぜか版面が…
トラックバック:0
コメント:0

続きを読むread more

PDFのセキュリティ 編集禁止って

編集部との打ち合わせで、意外な勘違いがあることに気付かされた。今日、会社のホームページで公開する資料をPDF化する作業をしていた。セキュリティ設定の段階になって、私は自分の信念に基づき、資料性が高くてなおかつ会社の収益に直接関係しないデータは内容のコピーぐらい認めるべきだと主張した。すると、もっと過激な人がいて、「このデータならセキュリ…
トラックバック:0
コメント:0

続きを読むread more

「PDFで縦書き明朝がゴシックに化ける怪」について

「PDFで縦書き明朝がゴシックに化ける怪」について この件、よくよく調べたら、InDesignの問題ではないらしいことが分かってきた。濡れ衣を着せてしまって申し訳ない。 PDFをさらに精査したところ、InDesignの機能で入力した縦書き明朝は、明朝体のまま表示されていた。 ゴシックに化ける問題の縦書き明朝は、Adobe Illus…
トラックバック:0
コメント:0

続きを読むread more

書籍のフォントはMS 明朝じゃないですよ

今日、人と話をしていてギャップを感じたこと。出版業界にいると当然なのだけれど、書籍のフォントはモリサワや写研の高価なものであり、MS 明朝・MS ゴシックではない。しかし、出版業界の外の人はこういうことを知らないらしく、DTPはMS 明朝・MS ゴシックでやっていると思っていたらしい。 自分は、モリサワのフォントと、MS 明朝の字形の…
トラックバック:0
コメント:6

続きを読むread more

PDFの専門家はどこにいる?

休日出勤して、誰もいないオフィスでPDFのチェックをしていたら、段々空しくなってきた。出版社だから、文字の校正とかをやる人はいくらでもいるのだが、PDFのデータの整合性チェックなどとなると、とたんに駒不足に陥ってしまう。 上司は「そんなもの外注してしまえ」と簡単に言ってくれるが、どこに外注すればいいのか、皆目見当がつかない。 D…
トラックバック:0
コメント:0

続きを読むread more

PDFで縦書き明朝がゴシックに化ける怪

DTPのオペレータさんにお願いして、Ryumin-Lightで縦書きの文字を入れたPDFをInDesignで作成し、Acrobatでフォントの埋め込みを解除してもらった。今まではAdobe Readerでしか見たことがなかったこともあり、それだと普通に表示されるので、何も不思議を感じることはなかった。 ところが、同じPDFファイルなの…
トラックバック:1
コメント:0

続きを読むread more

SumartraPDF viewerにはやはり環境変数の設定が必要

テスト用のPDFの日本語文字が、パソコンによってうまく表示されたり、化けてしまったりするのが気になってよく調べた。そして、結局のところ、環境変数CMAPDIRを設定していないパソコンで文字化けが発生するのだということがわかった。 どのバージョンからか日本語が表示されるようになっていたのでラッキーと思っていたのだが、どうやら私の勘違い。…
トラックバック:0
コメント:0

続きを読むread more

SumatraPDF viewer 0.8で日本語 がんばった

フリー&オープンソースということで、どうしても SumatraPDF viewer には肩入れしたくなってしまう。というわけで、先日来のPDF表示テストの一環として、適切に環境変数「CMAPDIR」を設定したうえで、SumatraPDF viewer を起動してみた。その結果がこれ。 日本語部分もきちんと表示されている。 S…
トラックバック:0
コメント:0

続きを読むread more

がんばれ SumatraPDF viewer

昨日のテスト用PDFで、日本語部分の文字が完全に化けてしまった SumatraPDF viewer。 よく見たら半角英数のグリフもおかしい。 いくらなんでもこの結果は変だ。実はパソコンによっては、日本語部分も表示されることがあるので。 それで、いろいろ調査していたところ、ずーっと以前にこのブログで、環境変数CMAPDIRを設定する…
トラックバック:0
コメント:0

続きを読むread more