ファイル形式について

音声データには様々なファイル形式が存在します。再生環境にあわせたファイル形式を選択することで、楽曲管理の手間が減ります。OTOTOYではWAV、ALAC、FLAC、MP3、AAC、DSDを取り扱い中です。ここでは各ファイル形式について説明します。

コンテナとコーデックについて

混同されることが多いコンテナとコーデックですが、コーデックが純粋に圧縮方法を指すことがわかればコンテナはそれ以外の諸々を指す(少々乱暴ですが)というふうに対比で理解できるのではないでしょうか。例をいくつか挙げます。flacはコンテナもコーデックもflacという名前が付いています。mp3もコンテナとコーデックが同じです(mpeg1に纏わるややこしい事情は割愛します)。OTOTOYのオーディオマスターデータとしてのWAVはコンテナがRIFFでコーデックはpcm_24leだったりpcm_32beだったり様々です。ALACはコンテナがmp4でコーデックがalacです。厳密に書くとややこしいので、一般的だと思われる形式を下記の表にまとめました。

形式主な拡張子圧縮可逆性スペック上限メタデータ埋込圧縮後サイズ
WAV.wav*32bit浮動小数点/768kHz×*(100%)
ALAC.m4a可逆32bit整数/192kHz60%〜70%
FLAC.flac可逆24bit整数/192KHz60%〜70%
MP3.mp3不可逆16bit/48kHz10%〜30%
AAC.m4a不可逆24bit整数/96KHz10%〜30%
DSF.dsf*1bit/11.2MHz*(100%)
DSDIFF.dff*1bit/11.2MHz×*(100%)
OTOTOYでの各ファイル形式

WAV

  • 一般的には非圧縮の音声ファイル形式
  • その仕様の柔軟性により、任意の量子化ビット数/サンプリング周波数を格納できる
  • 非圧縮のため元のデータを変化させない
  • 同音質のALACとFLACと比較するとデータ容量は大きい
  • 特性上、ジャケット写真の埋め込み、楽曲情報の記録の自由度が低く、統一規格が事実上存在しない

※ダウンロード後、再生ソフト上で楽曲情報を入力/変更できることが多い

ALAC (Apple Lossless)

  • Appleが開発した可逆圧縮の圧縮形式
  • コンテナはmp4
  • 量子化ビット数/サンプリング周波数は32bit整数/384kHzまで対応
  • 元のデータへ解凍可能な状態で圧縮して保存されているため、理論上、圧縮での音質の劣化はない
  • データ容量がWAVと比べて70%から60%まで小さくなる
  • ジャケット画像の埋め込み、楽曲情報の記録ができる
  • 対応再生ソフトはFLACに比べて若干少ないがほぼ問題ないレベル。iTunesは対応している。
  • iTunesで楽曲管理を行っている方にオススメ

※ 24bit/48kHzを超える音声ファイルに対して、現状iOSデバイス(iPhone / iPod / iPad)が非対応のため、PC上では再生できるが、iTunesからiOSデバイスへ転送し再生することはできない(WAVも同様)。

FLAC >> 解説・聴き方の詳細

  • 可逆圧縮の音声ファイル形式
  • 量子化ビット数/サンプリング周波数は24bit/192kHzまで対応
  • 元のデータへ解凍可能な状態で圧縮して保存されているため、理論上、圧縮での音質の劣化はない
  • データサイズがWAVと比べて70%から60%まで小さくなる
  • ジャケット画像の埋め込み、楽曲情報の記録ができる
  • 多くの再生ソフトに対応しているがiTunesでは再生できない

MP3

  • 非可逆圧縮の音声ファイル形式
  • OTOTOYでは2013年9月以降の配信音源をビットレートを320kbpsに規定
  • 量子化ビット数/サンプリング周波数は16bit/48kHzまで対応できる
  • 心理的聴覚モデルなどを基に、聴こえない"とされる"音声データを間引いて圧縮しているため、量子化ビット数/サンプリング周波数が16bit/48kHzであっても非圧縮や可逆圧縮の音声ファイルより音質が劣る
  • データサイズがWAVと比べておよそ30%から10%まで小さくなる
  • ジャケット画像の埋め込み、楽曲情報の記録ができる

AAC

  • MP3をベースに様々な拡張を施した方式
  • コンテナはmp4
  • iTunes Storeが採用している不可逆圧縮の音声ファイル形式
  • OTOTOYではビットレートを320kbpsに規定
  • 量子化ビット数/サンプリング周波数は24bit/96kHzまで対応(圧縮音源のためOTOTOYではハイレゾとは呼ばない。「ハイレゾ級」と呼ぶことはある)
  • 心理的聴覚モデルなどを基に、聴こえない"とされる"音声データを間引いて圧縮しているため、量子化ビット数/サンプリング周波数が24bit/96kHzであっても非圧縮や可逆圧縮の音声ファイルより音質が劣る
  • データサイズがWAVと比べておよそ30%から10%まで小さくなる
  • ジャケット画像の埋め込み、楽曲情報の記録ができる

DSD >>解説・聴き方の詳細

  • 時間軸を極めて細かく分割し1bitの疎密波として記録する
  • サンプリング周波数は2.8224MHz(CDの64倍でDSD64とも呼ばれる)、5.6448MHz(DSD128)、11.2896MHz(DSD256)の3つのフォーマットが現在用いられている
  • 甚大な情報量によって記録された音源は、奏でられた音そのものはもとより、会場の空気をも甦らせ、アナログ・レコードのような滑らかさと、デジタルならではの透明度を合わせ持つ
  • DSFにはジャケット画像の埋め込み、楽曲情報の記録がID3タグを使って可能
  • DSD対応機器やソフトウェア以外では再生できない