HTML からプレーンテキストへ
テキスト
DOM ラウンドトリップなしで、専用に作られた小さなパーサーで入力を一度走査 — テキストコンテンツのみを発行。`<script>`、`<style>`、`<iframe>` などはその内容と一緒に破棄;ブロックレベルのタグ(`<p>`、`<h1>`、`<li>`、…)は改行になる;`&` や `©` のようなエンティティは元の文字にデコード。CMS やメールからリッチテキストをコピーして Markdown ファイル、スプレッドシート、ターミナル用のプレーンコンテンツが必要なときに便利。
—
プレーンテキスト (62 文字)
Hello, world! This is a link & some text. One Two End.
タグの除去はサニタイザーではない — 敵対的な HTML を信頼してはならず、再レンダリングするなら DOMPurify を通すこと。
使い方
- 入力に HTML スニペットを貼り付け。
- オプションを好みでトグル — ブロックレベルの改行を保持、空白の連続を圧縮、エンティティをデコード。
- 出力をコピー。文字数が表示されるのでフィールド長制限を確認可能。
よくある質問
- なぜブラウザの `innerText` を使わない?
- `innerText` は動くが、CSS レイアウトを引き込む(ドキュメントのスタイルシートに基づいて変わる)し、DOM を構築してからでないと実行されない。このツールは小さな純粋パーサー — スタイルに関係なく、同じ入力に対して常に同じ出力を生成する。
- `preserveBreaks` のオン / オフの違いは?
- オンにすると、ブロックレベルのタグ(`<p>`、`<h1>`、`<li>`、`<br>`、…)が出力で改行になる。オフでは入力全体が 1 行に圧縮される — CSV セルや 1 行タイトルにテキストが必要なときに便利。
- 入力はサニタイズされる?
- すべてのタグが取り除かれる — 出力に HTML はない — がパーサーは意図的に最小限。レンダリングする予定の信頼できない HTML には、strip ステップに頼らず DOMPurify のような本物のサニタイザーを通すこと。
関連ツール
URL スラッグジェネレーター
任意のテキストを URL スラッグに変換 — アクセント除去、区切り選択、最大長指定。
テキスト00
Markdown テーブル生成
CSV・TSV・パイプ区切りデータを整列された GitHub 風 Markdown テーブルに変換。
テキスト00
テキスト Diff ビューア
2 つのテキストを行 / 単語単位で比較し、追加・削除をハイライト。
テキスト00
Lorem Ipsum ジェネレーター
段落・文・単語の単位でダミーテキストを生成。
テキスト00
大文字・小文字変換
大文字・小文字・Title・camelCase・snake_case などに変換。
テキスト00
文字数・単語数カウンター
文字・単語・文・行・バイト数をリアルタイムで数えます。
テキスト00