日本語 へ戻る
文字化け復元

文字化け復元

文字化けしたテキストを貼り付けるだけで、Shift_JIS / EUC-JP / UTF-8 / Latin-1 の誤読パターンを総当たりで試し、日本語らしさスコアが高い順に復元候補を並べます。ブラウザ内で完結。

日本語テキスト変換

使い方

文字化けしたテキストを貼り付けて「復元する」を押すだけ。Shift_JIS / EUC-JP / UTF-8 / Latin-1 (ISO-8859-1) の組み合わせで「(元のエンコーディング → 誤読したエンコーディング)」のペアを総当たりで試し、各復元結果の「日本語らしさ」(ひらがな / カタカナ / 漢字の割合 - 制御文字や U+FFFD の割合) でスコアを付けて、上位の候補を順に表示します。元と同じ結果や U+FFFD だらけの候補は自動で除外されます。サーバー送信は一切なく、変換は encoding-japanese (MIT) と自前の Latin-1 codec をブラウザ内で動かします。

よくある質問

入力テキストはサーバーに送信されますか?
いいえ。すべてブラウザ内で完結します。encoding-japanese (MIT) でバイト列を組み立てる処理も、Latin-1 の自前 codec も、すべてクライアント側 JavaScript で実行されます。
どんな文字化けパターンに対応していますか?
(元エンコ, 誤読エンコ) のペアとして、(UTF-8, Shift_JIS) / (UTF-8, EUC-JP) / (UTF-8, Latin-1) / (Shift_JIS, UTF-8) / (Shift_JIS, EUC-JP) / (EUC-JP, UTF-8) / (EUC-JP, Shift_JIS) / (Latin-1, UTF-8) の 8 通りを試します。日常的に遭遇する文字化けはこの範囲でカバーできます。
Shift_JIS のファイルを UTF-8 で開いたら U+FFFD だらけになりました。本ツールで復元できますか?
ファイル自体が U+FFFD (置換文字) に置き換えられて保存されている場合は、元のバイト列が失われているため復元できません。テキストエディタで開き直して別のエンコーディング (例: Shift_JIS) として再読み込みできるなら、その時点でのテキストを本ツールに貼り付けてください。
「日本語らしさスコア」はどう計算していますか?
復元結果の中の (ひらがな + カタカナ + CJK 漢字) の文字数を全文字数で割った値を加点し、U+FFFD や C0 制御文字 (改行・タブを除く) の割合を減点します。0 以下の候補は除外し、降順で並べます。
ファイル単位でエンコーディング変換したいです
CSV / TSV / TXT ファイルの一括変換は CSV エンコーディング変換ツールを使ってください。本ツールは「表示されているテキスト」を直接復元する用途に特化しています。

類似のツール

CSV / テキスト文字コード変換 — Shift_JIS ⇄ UTF-8 / BOM / 改行

CSV / テキスト文字コード変換 — Shift_JIS ⇄ UTF-8 / BOM / 改行

Shift_JIS (CP932) と UTF-8、UTF-16LE、EUC-JP の間で CSV / テキストファイルを変換します。Excel が出す Shift_JIS の文字化け、UTF-8 のテキストを古いシステムに渡せない問題、Excel が BOM 無し UTF-8 を文字化けさせる問題などに対応。BOM 付与/除去、改行コード (CRLF / LF / CR) の差し替え、入力エンコーディング自動判定をサポート。複数ファイルを一括変換して ZIP で受け取れます。アップロードしたファイルは外部に送信されず、すべての処理はブラウザ内で完結します。

開発テキスト変換
ひらがな ⇄ カタカナ 変換 — 文字単位で一括相互変換

ひらがな ⇄ カタカナ 変換 — 文字単位で一括相互変換

ひらがな⇄カタカナをモード切替で双方向に変換します。文字単位の機械的な置換なので辞書ダウンロード不要、瞬時に動作。長音「ー」や記号、漢字・英数字はそのまま保持。すべてブラウザ内で処理。

日本語変換
全角 ⇄ 半角 変換 — 英数字・カナ・記号を一括変換

全角 ⇄ 半角 変換 — 英数字・カナ・記号を一括変換

全角 ASCII (英数字・記号・スペース) と半角 ASCII をモード切替で双方向に変換します。U+FF01〜U+FF5E ⇄ U+0021〜U+007E のシフト、全角スペース U+3000 ⇄ 半角スペース U+0020 にも対応。カタカナ・ひらがな・漢字はそのまま保持。すべてブラウザ内で処理。

日本語変換
漢数字変換

漢数字変換

漢数字とアラビア数字を相互変換します。命数法 (千二百三十四)・大字 (壱弐参拾 — 契約書や手形で使う改ざん防止表記)・位取り (二〇二六) の 3 形式に対応。万・億・兆・京・垓まで対応し、大字や全角数字・桁区切りカンマも自動認識。ブラウザ内のみで実行、サーバーに送信しません。

日本語変換テキスト