모든 가중치 w들의 제곱합을 비용함수에 추가 기존의 비용함수 각 가중치항에대하여 21λw2를 더한다 가중치를 0으로 만들지는 않는다 부드러운 제약이고, 안정적이다. 이게 보통 많이 쓰이는 정규화이다. optim.Adam()에 weight decay값을 주면 L2정규화 효과를 낸다.