유니코드 문자 검사기
텍스트
이 도구의 모든 문자는 행을 받음 — 문자 자체·`U+HHHH` 16진수 코드포인트·UTF-8 바이트 시퀀스·HTML 십진 엔티티(`&#NNNN;`)·CSS 이스케이프(`\HHHH`)·소속 유니코드 블록. 모지바케 디버깅·헷갈리는 문자의 정확한 코드포인트 찾기(하이픈-마이너스인가 엠 대시인가?)·UTF-8 저장 시 문자열이 차지하는 바이트 수 확인에 유용. Array.from으로 적절한 코드포인트 순회 — 서로게이트 쌍 올바르게 처리.
—
string.length
13
코드포인트
12
UTF-8 바이트
19
| 문자 | 코드포인트 | UTF-8 바이트 | HTML 엔티티 | CSS 이스케이프 | 블록 |
|---|---|---|---|---|---|
| H | U+0048 | 48 | H | \0048 | Basic Latin (ASCII) |
| e | U+0065 | 65 | e | \0065 | Basic Latin (ASCII) |
| l | U+006C | 6C | l | \006C | Basic Latin (ASCII) |
| l | U+006C | 6C | l | \006C | Basic Latin (ASCII) |
| o | U+006F | 6F | o | \006F | Basic Latin (ASCII) |
| , | U+002C | 2C | , | \002C | Basic Latin (ASCII) |
| ␠ | U+0020 | 20 |   | \0020 | Basic Latin (ASCII) |
| 世 | U+4E16 | E4 B8 96 | 世 | \4E16 | CJK Unified Ideographs |
| 界 | U+754C | E7 95 8C | 界 | \754C | CJK Unified Ideographs |
| ! | U+0021 | 21 | ! | \0021 | Basic Latin (ASCII) |
| ␠ | U+0020 | 20 |   | \0020 | Basic Latin (ASCII) |
| 🌏 | U+1F30F | F0 9F 8C 8F | 🌏 | \1F30F | Miscellaneous Symbols & Pictographs |
코드포인트는 Array.from으로 순회(서로게이트 쌍 안전). 블록 이름은 가장 흔한 유니코드 범위 커버 — 틈새 블록은 '—' 표시.
사용법
- 입력란에 텍스트 붙여넣기·입력.
- 테이블에서 각 문자의 메타데이터 확인.
- 복사 버튼으로 파싱된 테이블 TSV 복사.
자주 묻는 질문
- 왜 🌏는 행 1개지만 len = 2?
- 이모지·기타 보충 평면 코드포인트(>U+FFFF)는 자바스크립트 문자열에서 2개 UTF-16 코드 유닛 차지·사용자 인식엔 한 문자. 도구는 행 수에 코드포인트(Array.from) 세지만 `string.length`도 별도 표시 — 불일치 확인 가능.
- 총 바이트가 UTF-8 칼럼과 동일?
- 네. 총 바이트 = 각 행의 UTF-8 바이트 합·엣지 케이스 정확도 위해 TextEncoder로 계산. 저장·와이어 포맷 크기 산정에 유용.
- 모지바케란?
- 잘못된 인코딩으로 바이트 해석한 깨진 텍스트. 클래식: UTF-8 'é'(C3 A9)을 Latin-1로 읽으면 'é'. 이 도구로 진단 가능 — 깨진 문자열 붙여넣고 코드포인트가 '잘못 디코드된 UTF-8' 결과와 맞는지 확인.
- 결합 문자·자소 클러스터는?
- 코드포인트 표시·자소 아님. 'é'는 코드포인트 1개(U+00E9)이거나 2개(e + 결합 예음, U+0065 + U+0301) 가능. 시각적 문자는 동일·바이트 표현은 다름. 적절한 자소 카운팅은 Intl.Segmenter 필요 — 이 도구 범위 밖.
관련 도구
URL 슬러그 생성기
어떤 텍스트든 깔끔한 URL 슬러그로 — 악센트 제거, 구분자 선택, 최대 길이 지정.
텍스트00
마크다운 표 생성기
CSV·TSV·파이프 구분 데이터를 정렬된 GitHub 마크다운 표로 변환합니다.
텍스트00
텍스트 Diff 뷰어
두 텍스트를 비교해 줄·단어 단위로 추가·삭제를 강조해서 보여 줍니다.
텍스트00
Lorem Ipsum 생성기
문단·문장·단어 단위로 자리표시자 텍스트를 생성하세요.
텍스트00
대소문자 변환기
대문자·소문자·Title·camelCase·snake_case 등으로 변환하세요.
텍스트00
글자수 단어수 카운터
글자·단어·문장·줄·바이트 수를 실시간으로 셉니다.
텍스트00