측정 항목 정리
글자수세기가 제공하는 항목들의 의미를 분석한다.
항목 1: 전체 글자
모든 문자(공백, 줄바꿈 포함)의 총합.
항목 2: 공백 제외
실제 텍스트의 분량 측정. 학술 논문에서 자주 사용.
항목 3: 단어 수
공백 기준 분리된 토큰의 개수.
항목 4: 문장 수
마침표, 물음표, 느낌표 기준. 글자수세기가 자동 분리.
항목 5: 단락 수
줄바꿈 두 번 기준의 단락 개수.
항목 6: 바이트
인코딩별 차이 측정. UTF-8 한글 3바이트.
분석 정리
- 전체
- 공백 제외
- 단어/문장/단락
- 바이트
활용 매핑
SNS는 전체, 학술은 공백 제외, DB는 바이트.
도구 활용
글자수세기는 모든 항목을 한 화면에 제공한다.
분석의 효용
항목별 의미를 알면 측정값을 정확히 활용할 수 있다.
마무리
측정의 정확성은 항목 이해에서 시작된다.