편향/분산 트레이드오프
모델의 새로운 데이터를 예측할 때, 모델의 오차는 다음 세 가지의 오차의 합으로 표현할 수 있다. 자세한 유도과정은 단순한 계산의 반복이기에 따로 다루지 않겠다.
(모델의 오차) = (편향)^2 + (분산) + (줄일 수 없는 오차)
•
•
•
따라서 모델의 오차를 평가할 때 편향과 분산을 고려한다. 일반적으로 모델의 복잡도가 커지면 분산은 증가하고 편향은 줄어드는 경향이 있다.
Q1. 위 그래프에서 가장 적절한 모델의 복잡도는 어느 부분일까?