개요
언어라는 현상을 모델링하고자 단어 시퀀스(문장)에 확률을 할당하는 모델. 단어 시퀀스에 확률을 할당하기 위해서 가장 보편적으로 사용되는 방법은 언어 모델이 이전 단어들이 주어졌을 때 다음 단어를 예측하도록 하는것이다.1
언어 모델을 만드는 방법은 크게는 통계를 이용한 방법과 인공 신경망을 이용한 방법으로 구분할 수 있다. 2
언어 모델이 이전 단어로부터 다음 단어를 예측하는 일을 언어 모델링이라고 한다.
주어진 이전 단어들로부터 다음 단어 예측하기
단어 시퀀스의 확률
하나의 단어를 , 단어 시퀀스를 라고 한가면, 개의 단어가 등장하는 단어 시퀀스 의 확률은 다음과 같다.
다음 단어 등장 확률
다음 단어의 등장 확률을 식으로 표현하여, 개의 단어가 나열된 상태에서 번째 단어의 확률은 다음과 같다.
전체 단어 시퀀스W의 확률은 모든 단어가 예측되고 나서야 알 수 있으므로 단어 시퀀스의 확률을 다음과 같다.