DTP駆け込み寺

No.14092の投稿者へメール送信

メール送信フォーム
補助
送信

[ 返信 ]

Re^2: PDFファイル数字のテキストが選択&抽出できない

早速のお返事ありがとうございます。
読み返すと少々わかりにくい文章だったかもと反省しています。

> InDesignから直接PDFにしているのですね。
はい、そうです。

> Times New Roman Regulerの半角数字が抜き出せない?
そうです。

> MS明朝の半角数字が抜き出せる?
> でしょうか?
ええっと、合成フォントを外してってことですよね。
駄目だったInDesignファイルを全てMS明朝に換えて検証してみました。大丈夫でした。

> AcrobatでPDFを開いて検索した際に、
> 数字の部分は検索でヒットしますか?
ヒットしません。
それで、お客様の方でも校正時にヒットしないことを懸念されているのだと思います。

> ヒットしなければ、対象のテキストをコピーしてみてください。
ありがとうございます。この辺りの説明が実は抜けていました。
一回目のPDFファイル@を全選択してテキストをコピペをした際に抽出されなかった英数は、半角スペースとなります。(この時選択できているように見えている数字もペーストすると半角スペースになっていたりします。)
そして、もう一度PDFをPDFに書き出したファイルAを全選択してテキストにコピペすると、先ほど半角スペースになってしまっていた英数がちゃんとテキストで現れ、それ以外の部分が■になってしまいます。
Aを全選択している時は、画面上で全部選択できてます。
そして検索にもヒットしているように思われます。

> 中黒のような表示の文字が抽出される場合は、
> もしかすると、CIDFontType2・CIDFontType0が
> 関係しているのではないかと推測されます。

中黒ではないような気がするのですが、CIDFontType2・CIDFontType0ですか?初めて聞く言葉です。
勉強不足ですみません。

因みにInDesignCS34を持っている方に同じファイルを渡してPDF書き出ししていただいたところ大丈夫でした。
よくわかりませんね。。

[14092] RKG (2012/05/29 Tue 15:52) mail