Microsoft社が販売するOfficeソフトのWordやExcelで、以前使用していたファイルフォーマット「*.doc」や「*.xls」などの仕様が公開されたので下記に紹介します。

 Microsoft社が提供する最近のOfficeソフトで作ったファイルはWordの場合は「docx」、Excelの場合は「xlsx」などの拡張子ファイルです。この*.docxや*.xlsxファイルは圧縮ファイルのzipファイルでできています。その証拠にWordやExcelで作った*.docxや*.xlsxの拡張子をzipに変更し、解凍ソフトで解凍するといくつかのxmlファイルで構成されているのがわかります。(このことはどこかで書いた気がするのですが、行方不明なのでもう一度書きました)

Wordファイルの*.docxを解凍しするとxmlファイルで構成されている

Wordファイルの*.docxを解凍しするとxmlファイルで構成されている

 これは確かOffice2007からできた仕様で、それまでのファイルは*.docや*.xlsなどのバイナリファイルでできています。いまだにこれらの種類のファイルを使用している人も多いのではないでしょうか?

 この古いファイルは完全なバイナリファイルなので中身がどのようになっているかはわかりませんでしたが、先日、Microsoft社はこれら旧Officeのファイルの仕様を公開しました。

Microsoft Office Binary (doc, xls, ppt) File Formats

 実際に覗いてみましたが、膨大な量のPDFファイルでもちろん英語。とても読めた物ではありませんでした(^_^;)。もし、興味のある人はダウンロードして読んでみてはいかがでしょう。

Microsoft、「.doc」「.xls」などのOfficeバイナリファイル仕様を公開:CodeZine

【旧商品】Microsoft Office Home and Business 2010 通常版 [ダウンロード]

【旧商品】Microsoft Office Home and Business 2010 通常版 [ダウンロード]

定価:¥ 34,800

カテゴリ:Software Download

発売日:2011-08-26