cost(W)=−n1∑i=1n∑j=1kyj(i)log(pj(i)) n = 1 : 하나의 샘플 k = 3 : 3 분류 cost(W)=−(y1log(p1)+y2log(p2)+y3log(p3)) pj : 한 샘플 내에서 예측값을 결정하는, 정답의 확률, p1+p2+p3=1 yj : 예측이 j일때 1인 One-Hot Vector의 요소 선택의 개념. y는 어떤 로그항을 사용할까 결정함