WinXPでAdobeReader8を使っています。
C社のデジカメPDFマニュアルで検索機能を利用すると、文中にはあるのに検索では上がってこない。
どうやら、マニュアルがUNICODEで作られているらしい。
文書内で検索したい文字列を探し出し、それをコピーして検索文字欄にペーストすると□□□が並ぶが、検索はできる。
文書内で検索したい文字列がどこにあるかが、わかっていればこの方法も使えるが果たしてこれでよいのか?
Reader8にはencodeを指定する設定項目が見つからないのですが、
どなたか同様にお困りの方は?
[8057] 大福餅 (2010/02/25 Thu 10:19)
『のだめ』が始まるまで時間があるので
ちょっと頑張って説明してみます。
検索出来ない
文字列を(見た目通りの文字として)コピー出来ない
そんなPDFって『あるんです』
作成するアプリケーション
と
PDF変換の方法
と
フォント
の組み合わせで
検索出来ない コピー出来ないPDFって出来ちゃうんです。
主にToUnicodeが指定されない
タイプのPDFで発生する事が多いようです。(確信なし)
Macの場合でナニですが
エクセルからOSAKAやMSフォント(TTタイプ)を
ディスティラ経由で作成(プリント)する方法で
検索出来ないコピー出来ないPDFを簡単に作れます。(笑)
フォントの埋め込み方法に関係していまして
例えば
『0』ゼロは
UTF8だと『30』なわけですが
上記の検索出来ないPDFを作ってみると
『F4808081』となっていて
その『F4808081』に『0』が表示されるフォントが
サブセットとして埋め込まれているので
見た目は『0』だけど文字列としては『0』ではない
って感じなんです。
そこで添付の画像になります。(フォントはOSAKA-mono)
Macの場合『F4808081』は『宇宙人語』とされていますので...笑
『F4808081』の宇宙人文字で『0』が検索出来ています。
ちなみにMacのエクセルの場合は
2008なら別名保存でPDF
か
プリント画面からOS標準のPDFとして保存を使えば
検索出来るPDFとなります。
Macな話が中心になっちゃいましたけど
参考にしてください。
[8076] にやり@空から日本面白かった (2010/02/26 Fri 00:21)
ポストしてから気がついた。汗
検索は出来ているんですね。
見た目通りの文字としては出来ないけど...汗
もしかしたら
私の勘違いな点がありましたら指摘してください>>all
(かなり自信無いんで...今回も....汗)
[8077] にやり@自己レス (2010/02/26 Fri 00:28)
ToUnicodeについて
アンテナハウスさんのBLOGに
詳しい内容の解説がありましたので
参考になると思います。
http://blog.antenna.co.jp/PDFTool/archives/2006/05/tounicode_cmap.html
ぜひ読んでみてください。
[8078] にやり@自己レス (2010/02/26 Fri 00:51) web
> アンテナハウスさんのBLOG
http://blog.antenna.co.jp/PDFTool/archives/2006/01/17/
を改めて自分で読んでみて
先の書き込みの
『フォントの埋め込み方法に関係』の下り
ちょっと私が勘違いして....汗
ほんと...参考程度で....滝汗
(あぁ自分の発言削除してぇ〜苦笑)
[8079] にやり@自己レス (2010/02/26 Fri 01:21) web
にやり@自己レスさま、ありがとうございます。
原因の所在に肉薄するブログを始めて見ました。
アンテナハウスさんもがんばってオープンしてくれていますね。
webでQ&Aなどに当たると、
「それは文字ではなく、画像化された文字ですよ」
とか
「セキュリティがかかっているものはコピーできません」
とか、ひどいのになると
「マウスがI形に変わってから操作する」とかの書き込みもありますね。
しかし、リーダーのほうで何とかなる方法がないものでしょうかね。
にやり@自己レスさまはご存知ないですか?
方法が無いとなると、このようなPDFの製品操作マニュアルを作っている企業のサービスというのは?と、思いたくなります。
検証もせず下請け任せなのかもしれません。
> > アンテナハウスさんのBLOG
> http://blog.antenna.co.jp/PDFTool/archives/2006/01/17/
>
> を改めて自分で読んでみて
> 先の書き込みの
> 『フォントの埋め込み方法に関係』の下り
> ちょっと私が勘違いして....汗
>
> ほんと...参考程度で....滝汗
>
> (あぁ自分の発言削除してぇ〜苦笑)
[8090] 大福餅 (2010/02/26 Fri 14:33)
> しかし、リーダーのほうで何とかなる方法がないものでしょうかね。
う〜ん
私の知っている限り『ありません』...汗
アクロバットのPROとかあればアウトラインとってOCRとか?....苦笑
何か方法があるなら私も教えてほしいっす>>>all
おわびと言ってはナニですが
私の勘違いしていた所を追記しておきます。
Macのエクセル2008からプリントメニュー経由でPS吐かせてみたら
なるほどと思えたので参考程度にメモしておきます。
エクセルのシート 左上のセルに
英数半角(この呼び方好きじゃないけど)の
『123567890』と入力してPSを吐かせてみます
Osakaー等幅
と
モリサワのオープンタイプ
で
PSファイルの中身を比較します。
----まずはOSAKA-MONOの場合
dup 33 /gid2 put
dup 34 /gid3 put
dup 35 /gid4 put
dup 36 /gid5 put
dup 37 /gid6 put
dup 38 /gid7 put
dup 39 /gid8 put
dup 40 /gid9 put
dup 41 /gid10 put
dup 42 /gid1 put
となって
/gid1 1 def
/gid2 2 def
/gid3 3 def
/gid4 4 def
/gid5 5 def
/gid6 6 def
/gid7 7 def
/gid8 8 def
/gid9 9 def
/gid10 10 def
って形で文字がヒモついているのに対して
(この時点で『0』って何?って事になってるし..W)
----モリサワオープンタイプは
dup 0 /uni0030.17 put
dup 1 /uni0031.18 put
dup 2 /uni0032.19 put
dup 3 /uni0033.20 put
dup 4 /uni0034.21 put
dup 5 /uni0035.22 put
dup 6 /uni0036.23 put
dup 7 /uni0037.24 put
dup 8 /uni0038.25 put
dup 9 /uni0039.26 put
と
ちゃんと文字コードとヒモついています。
同じアプリケーション
で
同じ作成(変換)方法でも
フォントが違えば
見た目の文字列をコピー出来ないPDFになってしまいます。
お力になれなくてナニですが
まぁ
人のフリ見て...って事で
自分も気をつけないといけないなぁと
(『0』に『/』斜線が入るのでOSAKA-MONO好きだし..W)
思いました。
印刷用としてではなくビジネス文章用やWEB公開用として
MSフォントやOSAKAフォントを使って
PDFを作られる方は
Macならディスティラを使わないようにするとか
WindowsでMSフォント等使う場合は
AdobePDFプリンタの
フォントの置換設定を見直しておかないといけないですね。
参考まで
[8105] にやり@今週長かったぁ (2010/02/27 Sat 02:05)
にやり様。ありがとうございます。大福餅です。
どうも、うまい方法がないようですね。
アクロバットで再読み込みなどを験しましたが、
うまくいきません。
そのふるいデジカメを譲ってくれた友人が、正しい選択というか、
無謀な試みというかC社に電話を入れて聞いたとして報告がありました。以下、又聞き。
「該当の古い機種のPDFマニュアルは確かに日本語で検索できない。」
「新しい機種のマニュアルは検索できるようになっている。」
「現状では日本語で検索できる方法はない。」
「日本語で検索できるようなマニュアルが欲しいとの要望があったことは関係部署につたえておく」
「日本語で検索できない」というのも、誤解を生むような表現ですが、
オペレーターとのやりとりであればこの程度だろうと思います。
unicodeのエンコードを変換できるようなユーティリティがないかどうか探してみます。
[8114] 大福餅 (2010/03/01 Mon 11:34)
ずいぶん前のですが
その後ちょっと進展したので自己レスしておきます。
PDFlib関連で配布されているプラグインで
PDFlib FontReporter
なるプラグインがあるのですが
このプラグインを使うと
サブセットとグリフの関係を確認できます。
字形等でトラブった時等に使えるかもしれませんね。
【要注意】
最近のアクロバットは『プラグイン』があると
アップデート時に『アップデート出来ない』事があります。
上記のプラグインを試す場合は
業務で使うマシン以外で試してくださいね。
画像はosaka等幅を埋め込んだ検索出来ないPDFを作った時の物です。
参考にしてください。
[10102] にやり@自己レス (2010/08/04 Wed 19:19)