Mini batch gradient descent : 미니 배치 단위로 경사 하강법을 수행

속도 빠름. 최적값 수렴 안정성 조금 낮음

Batch gradient descent : 전체 데이터에 대해 한 번에 경사 하강법을 수행

계산량 많음. 최적값 수렴 안정성 높음