AZ Tools

HTML からプレーンテキストへ

テキスト

DOM ラウンドトリップなしで、専用に作られた小さなパーサーで入力を一度走査 — テキストコンテンツのみを発行。`<script>`、`<style>`、`<iframe>` などはその内容と一緒に破棄;ブロックレベルのタグ(`<p>`、`<h1>`、`<li>`、…)は改行になる;`&amp;` や `&copy;` のようなエンティティは元の文字にデコード。CMS やメールからリッチテキストをコピーして Markdown ファイル、スプレッドシート、ターミナル用のプレーンコンテンツが必要なときに便利。

プレーンテキスト (62 文字)
Hello, world!

This is a link &amp; some text.

One

Two

End.

タグの除去はサニタイザーではない — 敵対的な HTML を信頼してはならず、再レンダリングするなら DOMPurify を通すこと。

使い方

  1. 入力に HTML スニペットを貼り付け。
  2. オプションを好みでトグル — ブロックレベルの改行を保持、空白の連続を圧縮、エンティティをデコード。
  3. 出力をコピー。文字数が表示されるのでフィールド長制限を確認可能。

よくある質問

なぜブラウザの `innerText` を使わない?
`innerText` は動くが、CSS レイアウトを引き込む(ドキュメントのスタイルシートに基づいて変わる)し、DOM を構築してからでないと実行されない。このツールは小さな純粋パーサー — スタイルに関係なく、同じ入力に対して常に同じ出力を生成する。
`preserveBreaks` のオン / オフの違いは?
オンにすると、ブロックレベルのタグ(`<p>`、`<h1>`、`<li>`、`<br>`、…)が出力で改行になる。オフでは入力全体が 1 行に圧縮される — CSV セルや 1 行タイトルにテキストが必要なときに便利。
入力はサニタイズされる?
すべてのタグが取り除かれる — 出力に HTML はない — がパーサーは意図的に最小限。レンダリングする予定の信頼できない HTML には、strip ステップに頼らず DOMPurify のような本物のサニタイザーを通すこと。

関連ツール