DTP駆け込み寺
  1. [15489] テキストエディットデータの文字化け じゅり 2013/04/20 22:26
    1. [15490] Re: テキストエディットデータの文字化け reg 2013/04/20 23:07
      1. [15491] Re^2: テキストエディットデータの文字化け じゅり 2013/04/20 23:28
        1. [15492] Re^3: テキストエディットデータの文字化け poi 2013/04/21 01:10
          1. [15493] Re^4: テキストエディットデータの文字化け じゅり 2013/04/21 01:45
            1. [15494] Re^5: テキストエディットデータの文字化け 流星光輝 2013/04/21 04:04
              1. [15495] Re^6: テキストエディットデータの文字化け じゅり 2013/04/21 12:07

[ 返信 ]

テキストエディットデータの文字化け

テキストエディットで文章データを作成中、
Macがフリーズしカーソルが画面上から消えたため電源の長押しで
強制終了しました。
その後パソコンを起動させたところ、問題のファイルが不可視状態となり、
そのファイルに新規のテキストエディットデータを入れたところ、
アイコンが出てきました。

出てきたアイコンをダブルクリックし起動させようとしたところ
「ファイル“○○.rtf”を開けませんでした」とエラーが表示されました。
(○○にはファイル名が入っています)

その後、ワード、エクセル、jedit、浮紙で強引に開いたところ、
開くことはできるのですが文字化けして
読める状態ではなくなってしまっています。
エンコードもいろいろと変えてみたのですが、一行も読めませんでした。

文章量はかなりあり(ファイルサイズで400kb以上あります)、
シンプルテキストでは開けません。
イラレやインデザイン、ページメーカーに配置や流し込みもできませんでした。

この状況が起きているのはこのファイルのみで、
他のデータは問題なく開きますし作業も出来ているので
このファイルの破損であるとは思うのですが、
本文テキストを取り出す方法はありますでしょうか?

パソコンの環境はマッキントッシュG5、OSは10.4.11です。

よろしくお願いします!

[15489] じゅり (2013/04/20 Sat 22:26) mail

[ 返信 ]


Re: テキストエディットデータの文字化け

拡張子を.txtにしてみるとか・

[15490] reg (2013/04/20 Sat 23:07)

[ 返信 ]


Re^2: テキストエディットデータの文字化け

回答ありがとうございます!

> 拡張子を.txtにしてみるとか・

すみません、書き忘れました。
拡張子の変更もやってみてます。
.txt .doc .html .htm .docx は試したのですが
全滅でした。

safariでも開いてみましたがムリでした。

[15491] じゅり (2013/04/20 Sat 23:28) mail

[ 返信 ]


Re^3: テキストエディットデータの文字化け

頭から文字化けしてるんでしょうか。
なんとなくヘッダーが抜け落ちてるだけみたいな気がする。

rtf 自体はバイナリじゃなくてテキスト形式だから
問題ない rtf とヘッダーを比較してみれば何とかなりそうな。
Mac だと何か違うのかな? windows 使いなので的外れならごめんなさい。

念のため wikipedia の rtf のサイトを紹介しますね。

[15492] poi (2013/04/21 Sun 01:10) web

[ 返信 ]


Re^4: テキストエディットデータの文字化け

回答ありがとうございます!

> 頭から文字化けしてるんでしょうか。
> なんとなくヘッダーが抜け落ちてるだけみたいな気がする。

はい。完全に文字化けしてます。
一文字も読めません(泣)

> rtf 自体はバイナリじゃなくてテキスト形式だから
> 問題ない rtf とヘッダーを比較してみれば何とかなりそうな。
> Mac だと何か違うのかな? windows 使いなので的外れならごめんなさい。

確認してみましたところ問題ないヘッダと表記が違ったので、
合わせて打ち直してみたり、コピぺしてみたりもしたのですが
やっぱりなんの変化もありませんでした。
私自身コードは全くわからないので、
もしかすると直す場所が違っているのかもしれないのですが。

拡張子をhtmlにすると頭は

{\rtf1\ansi\deff0{\fonttbl{\f0\fnil\fcharset128 \'82\'6c\'82\'72 \'83\'53\'83\'56\'83\'62\'83\'4e;}} {\*\generator Msftedit 5.41.15.1507;}\viewkind4\uc1\pard\lang1041\f0\fs20
hdfm\'00\'00\'00\'00\'05\{\'15\'00\'15\'00\'01\'039.2\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\tab "\'ff\'c31\'81\'45^'\'00\'00\'008\'03\'01\'00\'01\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00]\'00\'02\'00\'00\'00\'00\'00\'00\'00\'00d\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'00\'f3\'ef\'9c\'60\'00\'02\'c6l\'91\'41\'c3'\'b8|\}\'1b\'bez\'de\'ae\\e\'ea\'9f\'b0\'d0n\'1c\'d8%\'cdp \'81\'45C8\'e7\'ca=tky\'04\}#

となり、

jeditやワードで開くと頭は

hdfm

[15493] じゅり (2013/04/21 Sun 01:45) mail

[ 返信 ]


Re^5: テキストエディットデータの文字化け

文字化けというより、rtfはプレーンテキストデータではないので、
一文字も読めないのは、ある意味正しいかなぁと思います。

で、ヘッダ情報にある文字コードの部分をデコードしてみると、
826c M
8272 S
8353 ゴ
8356 シ
8362 ッ
834e ク
のようになります(なりました)。

1){の個数と}の個数が一致しているか、テキストエディタで{を検索して{で置換して置換個数を確認
2)}を検索して}で置換して置換個数を確認
3){と}の置換個数が一致していないとWordでは「文書名またはパスが間違っています〜」とダイアログを表示してきます。

あとは、RTF仕様に基づいて解析して復旧する感じでしょうか。

ちなみに、{\rtf1で始まっているみたいなので、
ヘッダ落ちというよりは、末尾で}が落ちているか、
タグが正常に閉じられていないので、
読み込みが正常終了しない系のような推測をしております。

何かの参考になれば幸いです。

[15494] 流星光輝 (2013/04/21 Sun 04:04) web

[ 返信 ]


Re^6: テキストエディットデータの文字化け

回答ありがとうございます!

締め切りがあるので、打ち直せるギリギリまで解析してみたいと思います!
……すぐわかるといいんですが……。

ありがとうございました!

[15495] じゅり (2013/04/21 Sun 12:07) mail