PDFについては、目に見える文字的なものと、裏で持つ文字コードがイコールとは限りません。
アウトライン化されていれば当然テキストとしては取れませんし、テキスト的な情報を持っていても生成方法やアプリケーション次第では異なるカスタムコードになることはあります。
CID系フォントについてはPDF内にCIDtoUnicodeのテーブルを適切に持つことなども必要になってきます。
よってその点をまずは作成元やアプリケーション仕様と確認することが必要です。
[20559] あさうす (2021/06/14 Mon 11:58)