Notice
Recent Posts
Recent Comments
Link
Douglas' Space
회귀 모델(Regression Model)의 평가지표 본문
Computing Tech. Diary/Artificial Intelligence
회귀 모델(Regression Model)의 평가지표
똘키아빠 2024. 11. 23. 13:28Ai기반 시스템의 시험평가를 위해서는 머신러닝 모델들의 다양한 평가지표를 이해하고 적절히 활용해야 합니다. 이번 부터 모델의 유형이나 목적에 따라 다르게 적용될 수 있는 여러 평가지표를 살펴보겠습니다. 먼저 회귀모델에 대한 평가지표를 살펴보겠습니다.
1. MSE (Mean Square Error, 평균 제곱 오차)
- 정의: MSE는 예측값과 실제값의 차이를 제곱한 후 평균을 구하는 방법입니다.
- 특징:
- 오차의 제곱을 취하기 때문에 큰 오차에 대해 패널티가 큽니다. 즉, 큰 오차를 강조하는 특성을 가집니다.
- 제곱을 사용하여 모든 오차가 양수로 변하므로, 양수와 음수 오차가 상쇄되지 않습니다.
- RMSE (Root Mean Square Error)와 MAE (Mean Absolute Error)도 유사한 방식으로 사용되며, RMSE는 MSE의 제곱근을 취한 형태입니다.
2. RMSLE (Root Mean Squared Log Error, 평균 제곱 로그 오차의 제곱근)
- 정의: RMSLE는 예측값과 실제값의 로그 차이를 제곱한 뒤 평균을 구하고, 그 제곱근을 취하는 지표입니다.
- 특징:
- 로그를 취하기 때문에 실제값과 예측값의 비율적인 차이를 측정할 수 있습니다.
- 값이 매우 클 때나 매우 작을 때의 오차를 안정적으로 측정할 수 있어, 극단적인 값의 영향력을 줄이는 데 유리합니다.
- 예측값이 음수가 될 수 없는 경우 주로 사용되며, 특히 데이터의 범위가 큰 경우 적합합니다.
3. R² (결정 계수)
- 정의: R²는 모델이 데이터를 얼마나 잘 설명하는지를 나타내는 지표로, 분산의 비율로 해석할 수 있습니다.
- 특징:
- 값은 0에서 1 사이이며, 1에 가까울수록 모델이 데이터를 잘 설명한다는 의미입니다.
- 음수가 될 수도 있으며, 이는 모델이 평균을 예측하는 것보다도 성능이 떨어진다는 것을 의미합니다.
- R²는 데이터의 분산을 기준으로 예측 성능을 측정하기 때문에, 모델의 전반적인 설명력을 평가하는 데 유리합니다.
4. MAPE (Mean Absolute Percentage Error, 평균 절대 백분율 오차)
- 정의: MAPE는 예측값과 실제값의 절대적인 오차를 실제값으로 나누어 백분율로 나타낸 후, 그 평균을 구하는 방식입니다.
- 특징:
- 백분율로 오차를 표현하므로 직관적인 해석이 가능합니다.
- 값이 0에 가까울수록 모델의 예측 성능이 좋다는 것을 의미합니다.
- 실제값이 0에 가까운 경우 문제가 발생할 수 있으며, 오차가 비율로 표현되므로 값이 매우 작거나 매우 큰 경우 과대평가될 수 있습니다.
5. 각 지표의 사용 목적
- MSE: 큰 오차를 강조하고 싶은 경우에 사용하며, 일반적인 회귀 모델의 손실 함수로 자주 사용됩니다.
- RMSLE: 로그를 사용하여 데이터의 스케일 차이를 줄이고 비율적인 변화를 강조하고 싶은 경우에 적합합니다.
- R²: 모델이 전체 데이터의 분산을 얼마나 설명하는지를 평가할 때 사용되며, 모델의 설명력을 확인하는 지표입니다.
- MAPE: 직관적인 오차의 백분율을 확인하고 싶은 경우에 유용하지만, 값이 0에 가까운 경우에는 적합하지 않을 수 있습니다.
'Computing Tech. Diary > Artificial Intelligence' 카테고리의 다른 글
분류 모델(Classification Model)의 평가 지표 (0) | 2024.11.24 |
---|---|
chatGPT에 대해서 (2) | 2023.03.25 |
ANSR Program (0) | 2022.10.20 |
ACE Program (0) | 2022.10.09 |
DARPA의 AI Next Campaign (0) | 2022.08.26 |
Comments