WAV 16-bit vs 24-bit vs 32-bit float — オーディオビット深度をどう選ぶか
録音 / 編集 / 配布 で WAV のビット深度をどう選ぶかを、ダイナミックレンジ / ファイルサイズ / クリッピング耐性 / 互換性 で比較。32-bit float が編集で重宝される理由と、16-bit で配布する基準を整理します。
4 つの判断軸 — レンジ / 容量 / クリップ耐性 / 互換性
WAV のビット深度選びは「数字が大きいほど高音質」という単純な話ではなく、4 つのトレードオフで決まります。ダイナミックレンジ は最弱音と最強音の比率で、ビット深度が直接決めます (16-bit で 96 dB、24-bit で 144 dB)。ファイルサイズ はビット深度に比例し、配布や長時間収録のコストに直結します。クリッピング耐性 (ヘッドルーム) は録音中にレベルが瞬間的に飛んでもサンプルを破壊しないか、を左右します。これは整数 PCM と 32-bit float の根本的な違いです。互換性 は CD / 配信 / 動画編集 / DAW など下流のワークフローで効きます。
「録音は 32-bit float、配布は 16-bit」というのが現代の標準ですが、なぜそうなるかは 4 軸で説明できます。録音現場ではレベル設定の失敗を後から救えるかが命なので 32-bit float、配布側は受け手が再エンコードするので深度を上げても無駄、という整理です。
3 つのビット深度の比較表
| 項目 | 16-bit PCM | 24-bit PCM | 32-bit float |
|---|---|---|---|
| 数値型 | 整数 (signed int) | 整数 (signed int) | IEEE 754 浮動小数 |
| 値の範囲 | -32,768 〜 +32,767 | 約 ±8,388,608 | -∞ 〜 +∞ (実用上 ±約 3.4×10^38) |
| 理論ダイナミックレンジ | 約 96 dB | 約 144 dB | 約 1,500 dB |
| 44.1 kHz ステレオ 1 分のサイズ | 約 10.1 MB | 約 15.1 MB | 約 20.2 MB |
| 1 時間の同条件サイズ | 約 605 MB | 約 908 MB | 約 1.21 GB |
| クリップ後の復元 | 不可 (情報喪失) | 不可 (情報喪失) | 可能 (-1.0 / +1.0 を超えた値も保持) |
| 主な用途 | CD / 配信用マスター | プロ録音 / 編集中間 | フィールド録音 / DAW プロジェクト |
| 標準対応 | 全プレイヤー / 全 OS | DAW / 多くのプレイヤー | DAW のみ、一般プレイヤーは未対応多数 |
| ディザリング | 上から落とすとき必須 | 通常不要 | 16-bit へ落とすときディザ必須 |
ダイナミックレンジ 96 dB は人間の可聴域 (静かな部屋で約 30 dB、ライブ会場で約 110 dB) を十分カバーしますが、これは 収録時のレベル設定がベスト だった場合の話です。録音レベルを保守的に低く取ると最大ピークが -20 dBFS あたりで、実質的に使えるのは 76 dB 程度まで落ちます。24-bit にすると同じ保守的設定でも実用 124 dB が確保でき、編集中のゲイン操作で量子化ノイズが浮く心配がほぼ消えます。
32-bit float が録音現場を席巻している理由はこの表の「クリップ後の復元」行です。Zoom F6 / Sound Devices MixPre 系の現代のフィールドレコーダーが 32-bit float を標準採用しているのは、赤ランプが点いてもサンプルが死なない から。整数 PCM ではアナログ入力が ±フルスケールを超えた瞬間にサンプルが飽和してその情報は永久に失われますが、32-bit float は -1.0 や +1.0 を超えた値もそのまま符号化できるため、後から DAW でゲインを下げれば波形が完全復元します。突然の大声・拍手・サイレンのような予測不能なピークが入っても、撮り直しが効かないインタビュー・ドキュメンタリー・ライブ収録の現場で保険として効きます。
ユースケース別の推奨
Spotify / Apple Music / YouTube への配信: 16-bit / 44.1 kHz。プラットフォームは受け取った音源を AAC / Opus に再エンコードするので、24-bit や 32-bit float で投げても結局 16-bit 相当に圧縮されます。マスタリング段階で 16-bit へ正規ディザして配布フォーマットに揃えるのが効率的。
フィールド録音・インタビュー・ロケ素材: 32-bit float / 48 kHz。録り直しが利かない現場で、レベル失敗の救済余地を最大化します。Zoom F6 / F3 / Sound Devices MixPre-II 以降が対応。
DAW のプロジェクト中間ファイル: 32-bit float、または 24-bit。ミックス中のゲイン操作・プラグイン処理で計算誤差が累積しないため。
動画ナレーション / Podcast の素人録音: 24-bit / 48 kHz。レベル設定をミスっても 144 dB のヘッドルームで救済可能。32-bit float に対応した録音機がなくても、24-bit なら大半のオーディオインターフェースで録れる。
CD マスタリング: 16-bit / 44.1 kHz (規格固定)。24-bit や 32-bit float の素材から最終工程でディザを入れて 16-bit に落とす。
サンプリングレート (44.1 kHz / 48 kHz / 96 kHz) の選び方 はビット深度と独立に決めます。配信は 44.1 kHz、動画系は 48 kHz、ハイレゾは 96 kHz / 192 kHz が定型。録音 → 編集 → 配布で 48 kHz を貫くと変換段が減って音質劣化が最小化されます。
ブラウザだけで変換するときのディザリングの罠
16-bit より上のビット深度から 16-bit へダウンコンバートするときは、必ずディザリング (微小なランダムノイズを足す処理) を入れる のが鉄則です。ディザなしで bit reduction するとサンプルが切り捨て / 四捨五入され、量子化歪み (倍音方向に偏る) が可聴ノイズとして残ります。逆に 16-bit → 24-bit / 32-bit float のアップコンバートは情報を増やすだけなので、ディザは不要です (というか入れても無意味)。
手元の WAV をビット深度や形式変換したいときは、audio-convert でブラウザ内完結の変換ができます。WAV / MP3 / OGG / FLAC / AAC / M4A の相互変換に対応し、複数ファイルをまとめて ZIP で受け取れます。アップロード型のオンライン変換と違って、未公開の素材や録音中のセッションを外部サーバーへ送る経路がコードに存在しません。実装は GitHub で公開されているので、DevTools の Network タブで「変換中にどこにも送信されていない」ことを目視確認できます。本番素材を扱うときの心理的負担が大きく下がります。