2020/03/31 00:00
ファイル形式について
音声データには様々なファイル形式が存在します。再生環境にあわせたファイル形式を選択することで、楽曲管理の手間が減ります。OTOTOYではWAV、ALAC、FLAC、MP3、AAC、DSDを取り扱い中です。ここでは各ファイル形式について説明します。
コンテナとコーデックについて
混同されることが多いコンテナとコーデックですが、コーデックが純粋に圧縮方法を指すことがわかればコンテナはそれ以外の諸々を指す(少々乱暴ですが)というふうに対比で理解できるのではないでしょうか。例をいくつか挙げます。flacはコンテナもコーデックもflacという名前が付いています。mp3もコンテナとコーデックが同じです(mpeg1に纏わるややこしい事情は割愛します)。OTOTOYのオーディオマスターデータとしてのWAVはコンテナがRIFFでコーデックはPCM 24bit Little EndianだったりPCM 32bit BIG ENDIANだったり様々です。ALACはコンテナがmp4でコーデックがalacです。厳密に書くとややこしいので、一般的だと思われる形式を下記の表にまとめました。
形式 | 主な拡張子 | 圧縮可逆性 | スペック上限 | メタデータ埋込 | 圧縮後サイズ |
---|---|---|---|---|---|
WAV | .wav | * | 32bit浮動小数点/768kHz | △ | *(100%) |
ALAC | .m4a | 可逆 | 32bit整数/192kHz | ○ | 60%〜70% |
FLAC | .flac | 可逆 | 24bit整数/192KHz | ○ | 60%〜70% |
MP3 | .mp3 | 不可逆 | 16bit/48kHz | ○ | 10%〜30% |
AAC | .m4a | 不可逆 | 24bit整数/96KHz | ○ | 10%〜30% |
DSF | .dsf | * | 1bit/22.4MHz | ○ | *(100%) |
DSDIFF | .dff | * | 1bit/22.4MHz | △ | *(100%) |
WAV
- 一般的には非圧縮の音声ファイル形式
- その仕様の柔軟性により、任意の量子化ビット数/サンプリング周波数を格納できる
- 非圧縮のため元のデータを変化させない
- 同音質のALACとFLACと比較するとデータ容量は大きい
- WAV(RIFF)本来のメタデータ規格が古く規格更新もされないので、ID3v2を埋め込む方法がデファクトスタンダードとして普及しつつある。このため、VLCやfoobar2000などの対応アプリではID3v2で可能なデータは全て入れられる。(OTOTOYでは2020年4月よりID3v2埋込に対応)
- OTOTOYではLIST, INF, INAM, IARTチャンクには対応していない
※ダウンロード後、再生ソフト上で楽曲情報を入力/変更できることが多い
ALAC (Apple Lossless)
- Appleが開発した可逆圧縮の圧縮形式
- コンテナはmp4
- 量子化ビット数/サンプリング周波数は32bit整数/384kHzまで対応
- 元のデータへ解凍可能な状態で圧縮して保存されているため、理論上、圧縮での音質の劣化はない
- データ容量がWAVと比べて70%から60%まで小さくなる
- ジャケット画像の埋め込み、楽曲情報の記録ができる
- 対応再生ソフトはFLACに比べて若干少ないがほぼ問題ないレベル。iTunesは対応している。
- iTunesで楽曲管理を行っている方にオススメ
※ 24bit/48kHzを超える音声ファイルに対して、現状iOSデバイス(iPhone / iPod / iPad)が非対応のため、PC上では再生できるが、iTunesからiOSデバイスへ転送し再生することはできない(WAVも同様)。
FLAC >> 解説・聴き方の詳細
- 可逆圧縮の音声ファイル形式
- 量子化ビット数/サンプリング周波数は24bit/192kHzまで対応
- 元のデータへ解凍可能な状態で圧縮して保存されているため、理論上、圧縮での音質の劣化はない
- データサイズがWAVと比べて70%から60%まで小さくなる
- ジャケット画像の埋め込み、楽曲情報の記録ができる
- 多くの再生ソフトに対応しているがiTunesでは再生できない
MP3
- 非可逆圧縮の音声ファイル形式
- OTOTOYでは2013年9月以降の配信音源をビットレートを320kbpsに規定
- 量子化ビット数/サンプリング周波数は16bit/48kHzまで対応できる
- 心理的聴覚モデルなどを基に、聴こえない"とされる"音声データを間引いて圧縮しているため、量子化ビット数/サンプリング周波数が16bit/48kHzであっても非圧縮や可逆圧縮の音声ファイルより音質が劣る
- データサイズが無圧縮音源(WAV)と比べておよそ30%から10%まで小さくなる
- ジャケット画像の埋め込み、楽曲情報の記録ができる
AAC
- MP3をベースに様々な拡張を施した方式
- OTOTOYでのコンテナ形式はmp4
- iTunes Storeが採用している不可逆圧縮の音声ファイル形式
- OTOTOYではビットレートを320kbpsに規定
- 量子化ビット数/サンプリング周波数は24bit/96kHzまで対応(圧縮音源のためOTOTOYではハイレゾとは呼ばない。「ハイレゾ級」と呼ぶことはある)
- 心理的聴覚モデルなどを基に、聴こえない"とされる"音声データを間引いて圧縮しているため、量子化ビット数/サンプリング周波数が24bit/96kHzであっても非圧縮や可逆圧縮の音声ファイルより音質が劣る
- データサイズがWAVと比べておよそ30%から10%まで小さくなる
- ジャケット画像の埋め込み、楽曲情報の記録ができる
DSD >>解説・聴き方の詳細
- 時間軸を極めて細かく分割し1bitの疎密波として記録する
- サンプリング周波数は2.8224MHz(CDの64倍でDSD64とも呼ばれる)、5.6448MHz(DSD128)、11.2896MHz(DSD256)の3つのフォーマットが現在用いられている
- 甚大な情報量によって記録された音源は、奏でられた音そのものはもとより、会場の空気をも甦らせ、アナログ・レコードのような滑らかさと、デジタルならではの透明度を併せ持つ、と言われる
- DSFにはジャケット画像の埋め込み、楽曲情報の記録がID3タグを使って可能
- DSDIFFでも上記WAVと同様な方法でID3v2タグを埋め込み可能(OTOTOYでも対応)
- DSD対応機器やソフトウェアが増加中