ファイルを解凍したらPDFのタイトルが文字化け

久々に、文字化けトピックです^^;
先日、期間限定で無料ダウンロードを開始した、文藝春秋の人気新書 生命保険のカラクリ をダウンロードし、Amazon Kindleで読もうとしました。
ファイルはZip形式で、Zipファイル名はseiho_karakuri.zip。
これをダウンロードして、解凍すると 生命保険のカラクリ というタイトルのPDFファイルが出来上がるのですが、なんとこのタイトルが文字化け。
(\(^o^)/・・・久々に、おもしろそうな文字化けなので、ついつい喜んでしまいました^^;)
本文(PDF内)はPCでもKindleでも文字化けせず読めるので、タイトルだけが文字化けという状態です。

一応、原因は何となくわかったものの解決方法がわかっていないので、ちょっと中途半端なのですが、とりあえず、今までわかったことを覚書として残しておこうと思います。
まず、Windows Vistaで上記のファイルをダウウンロードして解凍し、PDFファイルの日本語タイトル(=ファイル名)が文字化けしていた時点で、最初に疑ったのは、 MacでZipファイルを作って、Windowsで解凍すると日本語ファイル名が文字化けする という、有名な^^;文字化け。
一応AppLocaleを使って解凍アプリケーションを起動し、解凍したところ日本語のタイトルが文字化けせずにPDFが出来上がりました。 (ということは、ファイル名のエンコードをSJISで行うとOKということ。)

ただし、このファイル(Windows上では文字化けせずに、日本語で表示されているファイル)をKindle(Linuxベース)へ持っていくと、やはり文字化け。
で次にMac OSXの方で解凍してみると、やはり文字化け。
何故、こんなことが起こるのかな~、と調べてみたところIBMのWindows のファイル名の文字コードについてという資料を発見。
基本的に、Windows2000、 WindowsXP などの NT 系 Windows カーネルでは、Windows カーネル内部では、ファイル名は全て Unicode で扱われているのだけれど、、状況によって SJIS への変換が行われいる模様。 で、その変換のひとつがファイル圧縮ツールを使ったときに行われているようです。
ただ、今回WindowsのNTFSに解凍しても、Unicodeになっていないようなのは、何故?という疑問とか、日本語ファイル名のエンコードをSJISからUnicodeに変える方法とか、日本語ファイル名をUnicodeにしてPDF作ると、Kindleでも文字化けしないことの確認とか、もしそうなら日本語ファイル名をUnicodeのまま圧縮するツール(Windows)とかをもう少し調べてみようかな。。。と。
ご存じの方いらっしゃったら、是非アドバイスを
 

Leave a Reply

Your email address will not be published. Required fields are marked *