| Top | Forum | OS Settings | Software Settings | Mojibake |

ファイルを解凍したらPDFのタイトルが文字化け

| No Comments | No TrackBacks

久々に、文字化けトピックです^^;

先日、期間限定で無料ダウンロードを開始した、文藝春秋の人気新書 生命保険のカラクリ をダウンロードし、Amazon Kindleで読もうとしました。

ファイルはZip形式で、Zipファイル名はseiho_karakuri.zip。
これをダウンロードして、解凍すると 生命保険のカラクリ というタイトルのPDFファイルが出来上がるのですが、なんとこのタイトルが文字化け。
(\(^o^)/・・・久々に、おもしろそうな文字化けなので、ついつい喜んでしまいました^^;)
本文(PDF内)はPCでもKindleでも文字化けせず読めるので、タイトルだけが文字化けという状態です。

一応、原因は何となくわかったものの解決方法がわかっていないので、ちょっと中途半端なのですが、とりあえず、今までわかったことを覚書として残しておこうと思います。

まず、Windows Vistaで上記のファイルをダウウンロードして解凍し、PDFファイルの日本語タイトル(=ファイル名)が文字化けしていた時点で、最初に疑ったのは、 MacでZipファイルを作って、Windowsで解凍すると日本語ファイル名が文字化けする という、有名な^^;文字化け。

一応AppLocaleを使って解凍アプリケーションを起動し、解凍したところ日本語のタイトルが文字化けせずにPDFが出来上がりました。 (ということは、ファイル名のエンコードをSJISで行うとOKということ。)

ただし、このファイル(Windows上では文字化けせずに、日本語で表示されているファイル)をKindle(Linuxベース)へ持っていくと、やはり文字化け。

で次にMac OSXの方で解凍してみると、やはり文字化け。

何故、こんなことが起こるのかな~、と調べてみたところIBMのWindows のファイル名の文字コードについてという資料を発見。

基本的に、Windows2000、 WindowsXP などの NT 系 Windows カーネルでは、Windows カーネル内部では、ファイル名は全て Unicode で扱われているのだけれど、、状況によって SJIS への変換が行われいる模様。 で、その変換のひとつがファイル圧縮ツールを使ったときに行われているようです。

ただ、今回WindowsのNTFSに解凍しても、Unicodeになっていないようなのは、何故?という疑問とか、日本語ファイル名のエンコードをSJISからUnicodeに変える方法とか、日本語ファイル名をUnicodeにしてPDF作ると、Kindleでも文字化けしないことの確認とか、もしそうなら日本語ファイル名をUnicodeのまま圧縮するツール(Windows)とかをもう少し調べてみようかな。。。と。

ご存じの方いらっしゃったら、是非アドバイスを

 

No TrackBacks

TrackBack URL: http://nihongopc.us/cgi/mt/mt-tb.cgi/660

Leave a comment

Pages

OpenID accepted here Learn more about OpenID
Powered by Movable Type 4.23-en






About this Entry

This page contains a single entry by WebMaster published on March 5, 2010 9:15 PM.

Apple iPad April 3 出荷開始 was the previous entry in this blog.

Google Map Bicycle is the next entry in this blog.

Find recent content on the main index or look in the archives to find all content.