모든 가중치 w들의 제곱합을 비용함수에 추가
기존의 비용함수 각 가중치항에대하여 를 더한다

  • 가중치를 0으로 만들지는 않는다
  • 부드러운 제약이고, 안정적이다.
    이게 보통 많이 쓰이는 정규화이다.
    optim.Adam()에 weight decay값을 주면 L2정규화 효과를 낸다.