개요
단어의 등장 순서를 고려하지 않는 빈도수 기반의 단어 표현 방법
단어의 순서는 전혀 고려하지 않고, 단어의 출현 빈도 (Frequency)에만 집중하는 텍스트 데이터의 수치화 표현 방법
주로 문서가 어떤 성격의 문서인지를 판단하는 작업에 쓰인다.
BoW를 만드는 과정
- 각 단어에 고유한 정수 인덱스를 부여한다.
- 각 인덱스의 위치에 단어 토큰의 등장 횟수를 기록한 벡터를 만든다.
단어의 등장 순서를 고려하지 않는 빈도수 기반의 단어 표현 방법
단어의 순서는 전혀 고려하지 않고, 단어의 출현 빈도 (Frequency)에만 집중하는 텍스트 데이터의 수치화 표현 방법
주로 문서가 어떤 성격의 문서인지를 판단하는 작업에 쓰인다.