Interview/ML

ML Interview - Z Score

김 정출 2024. 11. 10. 15:06

Z Score

  • Z Score(또는 Z-점수)는 데이터 포인트가 평균에서 얼마나 떨어져 있는지를 표준 편차 단위로 나타내는 지표입니다.
  • Z Score는 통계학과 머신러닝에서 데이터의 표준화를 위해 자주 사용됩니다. 이는 각 데이터 포인트가 평균보다 얼마나 높은지 또는 낮은지를 나타내며, 주로 데이터 분포를 비교하거나 이상치를 감지하는 데 유용합니다.

Z Score 계산 공식은 다음과 같습니다:

Z = (X − μ) / σ

- X: 데이터 포인트,
- μ: 데이터셋의 평균,
- σ: 데이터셋의 표준 편차입니다.

 

Z Score의 의미:

  • Z Score가 0에 가까우면 데이터 포인트가 평균에 가깝다는 것을 의미합니다.
  • Z Score가 양수면 평균보다 크고, 음수면 평균보다 작습니다.
  • Z Score의 절대값이 클수록 평균에서 멀리 떨어져 있음을 의미하므로, 보통 절대값이 3을 넘으면 이상치로 간주됩니다.

 

이 방법은 표준 정규 분포로 데이터를 변환할 수 있어, 다양한 머신러닝 알고리즘에서 데이터의 스케일을 맞추기 위해 유용하게 사용됩니다.