開発 へ戻る
テーブルビューワー — Parquet / CSV / TSV / JSON Lines をブラウザで開く

テーブルビューワー — Parquet / CSV / TSV / JSON Lines をブラウザで開く

Parquet (Apache Parquet) / CSV / TSV / PSV / JSON Lines を 1 つのツールでドロップ → 表形式表示するビューワー。ファイル拡張子から形式を自動判定し、Parquet は hyparquet (MIT, ~220KB JS、WASM 不要)、CSV / TSV は RFC 4180 準拠の自前パーサ、JSON Lines は 1 行 1 JSON で解析。列ヘッダクリックで昇順 / 降順ソート、全文検索ボックスで全列対象に部分一致絞り込み、100 / 500 / 1000 / 全件 のページネーション。読み込んだデータは CSV / Parquet のどちらでもダウンロード可能なので、CSV ↔ Parquet 相互変換ツールとしても機能します。ファイルはすべてブラウザ内で読み込まれ、サーバーには送信されません。

開発変換

使い方

1) .parquet / .csv / .tsv / .psv / .jsonl のいずれかをドロップエリアに入れます。拡張子から自動で形式を判定。 2) 表が表示されたら、列ヘッダをクリックして昇順/降順ソート、上の検索ボックスで全文検索 (全列対象の部分一致)、下のページネーションで 100 / 500 / 1000 / 全件 を切り替え。 3) ダウンロードボタンで CSV / Parquet として保存。 4) 別のファイルに切り替えたいときは『リセット』をクリック。

よくある質問

Parquet ってなに?
Apache Parquet は列指向 (columnar) のバイナリデータファイル形式で、大規模データ分析・データレイク・ML データセット (Hugging Face datasets など) で標準的に使われます。同じデータでも CSV と比べて 1/3 〜 1/10 のサイズに圧縮でき、列単位で読み出せるため特定列だけのクエリも高速。本ツールでは hyparquet (MIT, ~220KB のピュア JS) を使ってブラウザ内で直接 parse します — WASM や外部 API 不要。
CSV ↔ Parquet 変換はどう使うの?
ファイルをドロップして読み込んだら、画面下の『Parquet ダウンロード』を押せば Parquet として、『CSV ダウンロード』で CSV として書き出せます。CSV を読み込んで Parquet で書き出せば CSV → Parquet 変換、逆も可能。型推論は数値・真偽値・文字列を自動判定し、Parquet では INT64 / DOUBLE / BOOLEAN / STRING にマッピングします。
対応するファイル形式の詳細は?
(1) **.parquet / .pq** — Apache Parquet (hyparquet)。Snappy / Gzip 圧縮、Plain / Dictionary / RLE エンコーディング、入れ子型 (List / Struct) は JSON 文字列化して表示。(2) **.csv** — RFC 4180 準拠、`,` 区切り、二重引用符による quote 処理、CR/LF/CRLF 改行対応。(3) **.tsv / .tab** — タブ区切り。(4) **.psv** — パイプ (`|`) 区切り。(5) **.jsonl / .ndjson** — 1 行 1 JSON オブジェクト (JSON Lines)、列名は全オブジェクトのキー和集合。
巨大なファイルでも開けますか?
ブラウザのメモリ上限まで対応します。実用的には: CSV 100MB / 100 万行、Parquet は圧縮効率が高いので 500MB / 500 万行 程度までは Chrome / Firefox で動作確認しています。これを超えるとブラウザがフリーズすることがあります。サーバーサイドの DuckDB / pandas / polars などの方が適しています。
Shift_JIS の CSV は読めますか?
本ツールは UTF-8 を前提に読み込みます。Shift_JIS / EUC-JP の CSV は文字化けする可能性があります。先に csv-encoding-convert ツールで UTF-8 に変換してからドロップしてください。BOM 付き UTF-8 は自動で BOM を除去するので問題ありません。
Parquet の入れ子型 (List / Struct / Map) は?
本ツールは『1 セル = 1 値』のテーブル表示なので、入れ子型は JSON 文字列化して表示します (`[1,2,3]` や `{a:1}` のような形)。完全な構造表示 (列展開) は将来の機能候補。
型推論はどう行われますか?
(CSV/TSV など) 各セルを `"true"/"false"` → boolean、数値パターンマッチ (`/^[+-]?\d+(\.\d+)?(?:[eE][+-]?\d+)?$/`) → number、それ以外 → string、`""/"null"/"NULL"` → null と判定。`"01"` のような先頭ゼロを保持したい場合は CSV 側で `"01"` (quote 必須) にしてください。Parquet は元のスキーマ型を尊重します。
セルがクリッピングされる
長い文字列を含むセルは表示幅で切り詰めます。クリックすると全文を表示する設計ですが、現状はホバー (`title` 属性) で全文確認できます。完全展開機能は将来追加予定。
ファイルはサーバーに送信されますか?
いいえ。Parquet の parse も CSV の parse も書き出しも、すべてブラウザ内 (hyparquet + 自前パーサ) で完結します。社内データ・機密データ・大量データを安心して読み込めます。

類似のツール

CSV ⇄ JSON 変換 — 区切り / ヘッダ自動判定

CSV ⇄ JSON 変換 — 区切り / ヘッダ自動判定

CSV と JSON を相互変換します。区切り文字 (カンマ / タブ / セミコロン) ・ヘッダー行有無・JSON インデントを切り替え可能。クォート/改行入りフィールドにも対応し、すべてブラウザ内で処理されます。

開発JSON変換
JSON 整形・検証 — インデント / 圧縮 / エラー表示

JSON 整形・検証 — インデント / 圧縮 / エラー表示

JSON をブラウザ内で整形 (インデント指定) ・最小化・バリデーションします。エラー行・列を表示。データは一切外部に送信されません。

開発JSON整形
CSV / テキスト文字コード変換 — Shift_JIS ⇄ UTF-8 / BOM / 改行

CSV / テキスト文字コード変換 — Shift_JIS ⇄ UTF-8 / BOM / 改行

Shift_JIS (CP932) と UTF-8、UTF-16LE、EUC-JP の間で CSV / テキストファイルを変換します。Excel が出す Shift_JIS の文字化け、UTF-8 のテキストを古いシステムに渡せない問題、Excel が BOM 無し UTF-8 を文字化けさせる問題などに対応。BOM 付与/除去、改行コード (CRLF / LF / CR) の差し替え、入力エンコーディング自動判定をサポート。複数ファイルを一括変換して ZIP で受け取れます。アップロードしたファイルは外部に送信されず、すべての処理はブラウザ内で完結します。

開発テキスト変換
XML 整形 — pretty / minify 切替で読みやすく / 1 行に

XML 整形 — pretty / minify 切替で読みやすく / 1 行に

XML を整形 (pretty / minify) するツール。fast-xml-parser でパースして自前の indent ロジックで Mode 切替: pretty (indent 2/4/タブ、改行入り、属性も整列) と minify (空白・改行を除去して 1 行に圧縮)。CDATA / コメント / processing instruction (`<?xml ... ?>`) / DOCTYPE 宣言 / 自己閉じタグ / 属性順を保持。XML 名前空間 (xmlns:foo) もそのまま維持。XML を JSON に変換したい場合は xml-json-convert を、HTML を整形したいなら HTML 用の別ツールを (XML パーサは HTML の `<br>` のような未閉じタグを許容しません)。すべてブラウザ内で処理。

開発変換