アップロードせずに本当に音声を変換できるのですか?

はい。ffmpeg.wasm（ffmpeg を WebAssembly 化したもの）がブラウザ内で動くため、音声ファイル自体がサーバーへ送信されることはありません。初回のみ ffmpeg.wasm 本体（約 30 MB）の読み込みがありますが、これはツールのコードであり、あなたの音声ファイルではありません。

対応している音声フォーマットは?

ffmpeg が扱える主要フォーマットすべて（MP3 / WAV / M4A / AAC / OGG / Opus / FLAC / WebM など）に対応しています。MIDI ファイルの解析や音声録音は専用ツールでサポートしています。

音声の文字起こしもブラウザ内で行われますか?

はい。voice-transcribe / audio-transcribe では Whisper モデルをブラウザに読み込み、文字起こしをローカルで実行します。音声データもテキスト結果も外部送信されません。モデルの初回ダウンロードのみネット接続が必要です。

編集できる音声の長さに制限はありますか?

サーバー上限はありませんが、長尺音声は端末のメモリを多く使用します。安定して扱える目安は 1 時間程度までです。それ以上の音声は事前に audio-cut で分割しておくと処理しやすくなります。

音声ツール

23 個のツール

録音・変換・編集・文字起こしなど、音声ファイルを扱うためのツール群。

タグ:

並び順:

1 ページあたり:

ツール一覧

23 / 23 件

BPM 自動検出 — 音声から BPM を推定

音声ファイル (MP3 / WAV / M4A / FLAC / OGG) をドロップすると、Web Audio API のローパスフィルタ + ピーク検出 + ヒストグラム解析で曲の BPM を自動推定します。DJ ミックスの相手曲、サンプル素材のテンポ確認、踊りやランニングのテンポ合わせ、bpm-time-stretch で揃える前の参考値取得などに便利。半分・倍テンポの候補も併記するので、4 つ打ちで 60 BPM と出たけど実際は 120 BPM、のような誤検出も自分で判断できます。音声はブラウザ内で完結。

音声テンポ

音声チャンネル結合 — 2 つのモノラルを L + R のステレオに

2 つのモノラル音声ファイル (MP3 / WAV / M4A / FLAC / OGG) を 1 つのステレオ音声に結合します。L チャンネルと R チャンネルを別々に渡すと、内部で interleave して 1 つの stereo WAV / MP3 として出力。インタビューの A 話者 / B 話者を別収録 → L / R に振り分けたい、片チャンネル素材から擬似ステレオを作りたい、audio-channel-split の逆操作で再合成したいときに使えます。長さが違う場合は短い方に合わせる / 長い方に合わせる (無音パディング) を選択可能。音声はブラウザ内で完結します。

音声結合

音声チャンネル分離 — ステレオ L / R を 2 つのモノラルに分割

ステレオ音声ファイル (MP3 / WAV / M4A / FLAC / OGG) を L (左) と R (右) の 2 つのモノラル WAV / MP3 として書き出します。社外録音 (インタビュー、口述記録、ZOOM 録音、ハンディレコーダー) で話者を L チャンネル / R チャンネルに分けて録ったときの分離編集、片チャンネルだけのノイズ除去、ステレオ素材から片側だけ DAW に取り込みたいときに最適。モノラル素材はそのまま 1 ファイル出力。音声はブラウザ内で完結します。

音声

音声フォーマット変換 — MP3 / WAV / M4A / OGG / FLAC

音声ファイルを mp3 / wav / m4a / ogg / flac へ変換します。ffmpeg.wasm が出力拡張子に応じてコーデックを選択して再エンコード。複数ファイル一括処理 + ZIP ダウンロード対応。ファイルはサーバーに送信されません。

音声変換

音声カット — 範囲指定で再エンコードなし切り出し

音声ファイルの特定区間を ffmpeg.wasm の stream copy で切り出します。再エンコードなし・拡張子そのまま。カット点はキーフレーム境界にスナップ。複数ファイル一括処理 + ZIP ダウンロード対応。

音声分割

音声フェード — フェードイン / フェードアウトを秒単位で適用

音声ファイルの先頭と末尾に任意秒のフェードイン / フェードアウト効果を入れます。ffmpeg.wasm の afade フィルタを使い、MP3 / WAV / M4A / OGG / FLAC など主要フォーマットに対応。複数ファイル一括処理 + ZIP ダウンロード対応。音声はサーバーに送信されません。

音声

音声結合 — 複数ファイルを 1 つに連結

複数の音声ファイルを ffmpeg.wasm の concat demuxer で結合します。ドラッグで並び替え。stream copy なので再エンコードなしですが、コーデック・サンプルレートが同じファイル同士のみ結合可能。

音声結合

音声メタデータ削除 — ID3 / アートワーク一括

音声ファイルから ID3 / Vorbis comment / iTunes メタなどを ffmpeg.wasm でブラウザ内だけで削除します。コーデックそのままの stream copy なので再エンコードなし・拡張子そのまま。複数ファイル一括処理 + ZIP ダウンロード対応。

音声EXIF

ノイズ生成 (ホワイト / ピンク / ブラウン)

ホワイトノイズ・ピンクノイズ・ブラウン (赤) ノイズをブラウザ内で合成してリアルタイム再生 + WAV ダウンロード。**ホワイト** は全周波数に均一なエネルギー (耳には高音寄り)、**ピンク** は 1 オクターブあたりエネルギー一定 (1/f スペクトル、自然界の音に近い)、**ブラウン** は -6 dB/oct で減衰する低音寄りスペクトル (海・滝の音に近い)。集中作業中のマスキング BGM、赤ちゃんの寝かしつけ、不眠対策、オーディオ機材のテストなどに。WAV (44.1 kHz / 16-bit / mono) で任意の長さ (0.5〜60 秒) をダウンロード可。すべてブラウザ内で完結し、サーバーへ送信しません。

生成

音声ピッチ変更 — テンポを保ったまま半音単位で上下

音声ファイル (MP3 / WAV / M4A / AAC / FLAC / OGG / Opus) のピッチをテンポを保ったまま半音単位 (±12 = 1 オクターブ) で上下できます。soundtouchjs を使い、Web Audio API のサンプルに対して SoundTouch ライブラリのピッチ変換を適用。カラオケのキー調整、語学教材のキー揃え、動画ナレーションのトーン調整、ボイスチェンジ的演出に。WAV / MP3 で書き出し、複数ファイル一括処理に対応。音声はブラウザ内でだけ処理され、外部に送信されません。

音声

音声ノイズ除去 — RNNoise (機械学習) でホワイトノイズや空調音を抑制

アップロードした音声ファイルから空調音・キーボード打鍵音・ホワイトノイズ・ブレスノイズなどの背景ノイズをディープラーニングで抑制し、ノイズ除去後の WAV をダウンロードできます。Xiph.org の RNNoise (BSD-3-Clause) を WebAssembly で実行するため、音声データはサーバーに送信されず、すべてブラウザ内で処理されます。Web Audio API で 48 kHz mono にリサンプリングし、RNNoise (10 ms = 480 サンプルのフレーム単位) で発話確率 (VAD) と一緒に推論。学習済みモデルが声を保ちつつ背景音を消すので、Zoom 録画 / Web 会議録音 / ポッドキャスト原稿 / 配信切り抜きの後処理に向きます。

音声

音声逆再生 — 音声を反転して WAV / MP3 で書き出し

音声ファイル (MP3 / WAV / M4A / AAC / FLAC / OGG / Opus) をブラウザ内で逆再生 (リバース) して、WAV または MP3 で書き出します。ASMR / 楽曲制作 / SNS 投稿 / 効果音作成に。Web Audio API でデコードしてサンプルを反転、ステレオはチャンネル別に正しく反転します。複数ファイル一括処理と ZIP まとめダウンロードに対応。元の音声データは外部に送信されません。

音声逆再生

音声テンポ変更 — ピッチを保ったまま速度を変更

音声ファイル (MP3 / WAV / M4A / AAC / FLAC / OGG / Opus) のテンポ (速度) をピッチ (音の高さ) を保ったまま変更できます。soundtouchjs (SoundTouch ライブラリ) のタイムストレッチを使い、Web Audio API のサンプルに対して 0.5x (半分) 〜 2.0x (2 倍) で再エンコード。語学教材のスロー再生、楽器の練習用スピード変更、ナレーションの調整、ポッドキャストの倍速書き出しなどに。WAV / MP3 で出力、複数ファイル一括処理に対応。音声はブラウザ内でだけ処理され、外部に送信されません。

音声

音声文字起こし — Whisper で多言語対応

MP3 / WAV / M4A などの音声ファイルをアップロードして、ブラウザ内で動く Whisper で文字起こし。長尺ファイルは自動でチャンク分割します。音声・モデルともに外部送信なし。動作速度・対応モデルの大きさはお使いの端末スペック (CPU / GPU / メモリ) に依存します。

音声文字起こしAI抽出

音声の無音カット — 前後の無音を自動で除去 (ffmpeg.wasm)

MP3 / WAV / M4A / AAC / OGG / OPUS / FLAC の先頭と末尾にある無音区間を ffmpeg.wasm の silenceremove フィルタでまるごと自動カットします。録音直後の数秒のしんとした部分、講演の出だしのもたつき、ポッドキャスト末尾の余韻が長すぎる場合などに。しきい値 (dB) と最小無音長 (秒) を細かく調整でき、前後どちらをカットするかも切り替えられます。複数ファイルを一括処理して ZIP でまとめて受け取れます。すべての処理はブラウザ内で完結し、ファイルは外部に送信されません。

音声抽出

音量調整 — dB 変更 / ノーマライズ / 倍率

音声ファイルの音量を ffmpeg.wasm の volume フィルタで一括調整します。dB スライダ (-30〜+30 dB) または倍率 (×0.03〜×31.6) を選択。+6 dB ≒ 2 倍、−6 dB ≒ 半分。クリッピングを避けたいときはピークメーター代わりにマイナス側で試して比較を。複数ファイル一括処理 + ZIP ダウンロード対応。すべてブラウザ内で完結し、音声は外部に送信されません。

音声

BPM タップ — ボタンを叩いてテンポを計測

リズムに合わせてボタン (またはスペースキー) を叩くと、直近のタップ間隔から BPM (1 分あたりの拍数) を中央値ベースで算出します。外れ値に強い median + IQR 安定度、最大過去 16 タップ、リセット / 履歴クリア対応。Web Audio による拍メトロノーム (任意) も同期再生可能。すべてブラウザ内で処理。

音声テンポ

BPM タイムストレッチ — 現 BPM から目標 BPM へテンポを揃える

音声ファイルの現在の BPM と目標 BPM を入力すると、`tempo = target / current` の比率で soundtouchjs (SoundTouch ライブラリ) がテンポを変換します。ピッチは保持されるので、DJ ミックスや楽器練習でテンポを揃える、ポッドキャストの収録ペース統一、ダンスレッスンの BPM 調整などに最適。複数ファイルを違う目標 BPM で揃えたい場合も一括対応。WAV / MP3 出力、音声はブラウザ内で完結します。

音声テンポ

メトロノーム — BPM・拍子・音色を選んで拍を鳴らす

BPM (30〜300)・拍子 (1〜12 拍)・音色 (クリック / 木魚 / カウベル) を選んで Web Audio API で拍を鳴らすメトロノーム。1 拍目に高音のアクセントを付け、現在の拍をライブで視覚表示します。look-ahead スケジューラで高精度なタイミング (テンポずれ <1ms)、音量 / ミュート対応。bpm-tap で計測したテンポを再生するときの相棒に。すべてブラウザ内で生成、データは送信しません。

音声テンポ

MIDI ファイル情報ビューア

MIDI ファイル (.mid / .midi) をドロップして、テンポ・拍子・調号・PPQ・トラック数・トラック毎の楽器 (GM 楽器ファミリ)・ノート数・演奏時間・チャンネル・コピーライト/テキストイベントを一覧表示します。書き換えなしの読み取り専用、@tonejs/midi (MIT) でブラウザ内のみ実行。

音声抽出

このカテゴリについて

音声ファイルの変換・編集・解析を、すべてブラウザ内で行うためのツール群です。ffmpeg.wasm を中心に、MP3 / WAV / M4A / AAC / OGG / Opus / FLAC など主要な音声フォーマットを扱えます。

録音した音声をすぐに編集したい、社外秘のインタビュー音源を外部に送らずに整音したい、長い会議録音から無音部分だけを切り詰めたい、Whisper でブラウザ内文字起こしを行いたい、配布前にファイルのメタデータを除去したい、といった用途に向いています。

主な使い所

ボイスメモの録音と、そのままの編集・MP3 化
MP3 ↔ WAV ↔ M4A ↔ FLAC など音声形式の相互変換
音声の特定区間の切り出し・複数音声の結合
音量の調整・フェードイン / フェードアウトの付与
会議録音やナレーション収録から無音部分を自動カット
ブラウザ内で完結する Whisper ベースの文字起こし
音声ファイルからメタデータ（タイトル・アーティスト等）を除去

このカテゴリのよくある質問

アップロードせずに本当に音声を変換できるのですか?: はい。ffmpeg.wasm（ffmpeg を WebAssembly 化したもの）がブラウザ内で動くため、音声ファイル自体がサーバーへ送信されることはありません。初回のみ ffmpeg.wasm 本体（約 30 MB）の読み込みがありますが、これはツールのコードであり、あなたの音声ファイルではありません。
対応している音声フォーマットは?: ffmpeg が扱える主要フォーマットすべて（MP3 / WAV / M4A / AAC / OGG / Opus / FLAC / WebM など）に対応しています。MIDI ファイルの解析や音声録音は専用ツールでサポートしています。
音声の文字起こしもブラウザ内で行われますか?: はい。voice-transcribe / audio-transcribe では Whisper モデルをブラウザに読み込み、文字起こしをローカルで実行します。音声データもテキスト結果も外部送信されません。モデルの初回ダウンロードのみネット接続が必要です。
編集できる音声の長さに制限はありますか?: サーバー上限はありませんが、長尺音声は端末のメモリを多く使用します。安定して扱える目安は 1 時間程度までです。それ以上の音声は事前に audio-cut で分割しておくと処理しやすくなります。

他のカテゴリ

動画

21 個のツール

画像

31 個のツール

PDF

23 個のツール

開発

87 個のツール

日本語

17 個のツール

金融

21 個のツール

時刻

18 個のツール

変換

12 個のツール

音声 ツール

ツール一覧

このカテゴリについて

主な使い所

このカテゴリのよくある質問

他のカテゴリ

音声ツール