CSV 統計 — 列ごとの件数 / ユニーク / 平均 / 中央値 / 標準偏差
CSV を貼り付けるかドロップするだけで、列ごとの行数・ユニーク値数・欠損数・推定型を自動集計します。数値列は最小 / 最大 / 平均 / 中央値 / 標準偏差 / 合計、文字列列は最頻値 (top 1) と平均文字数を表示。RFC 4180 準拠 (ダブルクォート・エスケープ対応)、区切りはカンマ / セミコロン / タブ / パイプを自動判定。ヘッダー行の有無トグルあり、欠損は空欄と NULL/NA を欠損扱い。生データは一切外部送信されず、すべてブラウザ内で完結します。
使い方
CSV または TSV を入力欄に貼り付けるだけで、ヘッダー行を自動認識し、列ごとに件数・ユニーク値数・欠損数・型 (数値 / 文字列 / 混在 / 空) を集計します。数値列はさらに 最小 / 最大 / 平均 / 中央値 / 標準偏差 / 合計 を、文字列列は 最頻値 (mode) と平均文字数を表示します。区切り文字はカンマ / セミコロン / タブ / パイプから自動判定 (手動指定も可)。集計結果は TSV としてコピー / ダウンロードできます。
よくある質問
- 対応している CSV 仕様は?
- RFC 4180 準拠です。ダブルクォートで囲まれたフィールドの中の改行 / カンマ / クォート (`""` でエスケープ) を正しく扱います。区切り文字はカンマ / セミコロン (欧州 CSV) / タブ (TSV) / パイプから自動判定。1 行目をヘッダーとして扱うトグルもあります。
- 欠損値はどう判定されますか?
- 空欄、`null` / `NULL`、`NA` / `n/a`、`NaN` を欠損として集計から除外します。ユニーク値の集計や数値統計はすべて非欠損のみで計算されます。
- 列の型はどう判定されますか?
- 全ての非欠損値が数値としてパースできれば「数値」、すべて非数値なら「文字列」、混在なら「混在」、全て欠損なら「空」です。混在列も最頻値や平均文字数は表示されますが、数値統計は計算されません。
- 桁区切りカンマ (例: 1,234) は数値として認識されますか?
- はい。数値判定の前にカンマを除去するので `1,234.56` は数値扱いになります。ただし区切り文字がカンマの CSV では桁区切り付き数値はクォートで囲む必要があります (例: `"1,234.56"`)。
- 巨大な CSV でも動きますか?
- 数万行 / 数 MB クラスはブラウザ上で問題なく集計できます。100 万行 / 100 MB クラスは現実的ではありませんが、すべてブラウザ内で完結するのでファイルはサーバーに送信されません。
- 数値の精度は?
- JavaScript の double 精度 (IEEE 754 64-bit) で計算します。表示は小数点以下 4 桁までフォーマットしていますが、TSV ダウンロード時は内部の生値を出力します。
- 入力データはサーバーに送信されますか?
- いいえ。CSV のパースと集計はすべてブラウザ内で完結します。ペーストした内容も、ダウンロードする TSV も外部に送信されません。
類似のツール
CSV ⇄ JSON 変換 — 区切り / ヘッダ自動判定
CSV と JSON を相互変換します。区切り文字 (カンマ / タブ / セミコロン) ・ヘッダー行有無・JSON インデントを切り替え可能。クォート/改行入りフィールドにも対応し、すべてブラウザ内で処理されます。
CSV / テキスト文字コード変換 — Shift_JIS ⇄ UTF-8 / BOM / 改行
Shift_JIS (CP932) と UTF-8、UTF-16LE、EUC-JP の間で CSV / テキストファイルを変換します。Excel が出す Shift_JIS の文字化け、UTF-8 のテキストを古いシステムに渡せない問題、Excel が BOM 無し UTF-8 を文字化けさせる問題などに対応。BOM 付与/除去、改行コード (CRLF / LF / CR) の差し替え、入力エンコーディング自動判定をサポート。複数ファイルを一括変換して ZIP で受け取れます。アップロードしたファイルは外部に送信されず、すべての処理はブラウザ内で完結します。
テーブルビューワー — Parquet / CSV / TSV / JSON Lines をブラウザで開く
Parquet (Apache Parquet) / CSV / TSV / PSV / JSON Lines を 1 つのツールでドロップ → 表形式表示するビューワー。ファイル拡張子から形式を自動判定し、Parquet は hyparquet (MIT, ~220KB JS、WASM 不要)、CSV / TSV は RFC 4180 準拠の自前パーサ、JSON Lines は 1 行 1 JSON で解析。列ヘッダクリックで昇順 / 降順ソート、全文検索ボックスで全列対象に部分一致絞り込み、100 / 500 / 1000 / 全件 のページネーション。読み込んだデータは CSV / Parquet のどちらでもダウンロード可能なので、CSV ↔ Parquet 相互変換ツールとしても機能します。ファイルはすべてブラウザ内で読み込まれ、サーバーには送信されません。
JSON → TypeScript 型定義生成
JSON を貼り付けると、対応する TypeScript の interface / type 定義を生成します。ネストしたオブジェクトは別 interface に分割、配列はキーをマージして一部だけに存在するキーを optional (?) に、混在する値は union 型に変換。ルート型名・interface / type 切替・export 付与を選べます。同じ構造の型は 1 つにまとめます。JSON はブラウザ内でだけ処理され、外部に送信されません。