Mini batch gradient descent : 미니 배치 단위로 경사 하강법을 수행
속도 빠름. 최적값 수렴 안정성 조금 낮음
Batch gradient descent : 전체 데이터에 대해 한 번에 경사 하강법을 수행
계산량 많음. 최적값 수렴 안정성 높음
Mini batch gradient descent : 미니 배치 단위로 경사 하강법을 수행
속도 빠름. 최적값 수렴 안정성 조금 낮음
Batch gradient descent : 전체 데이터에 대해 한 번에 경사 하강법을 수행
계산량 많음. 최적값 수렴 안정성 높음