전이 학습 (Transfer Learning)
전이 학습은 기존에 학습된 모델의 지식을 새로운 문제에 적용하는 방법으로, 특히 소수 클래스에 대한 데이터가 부족할 때 효과적입니다. 이를 통해 모델이 적은 데이터로도 일반화 능력을 유지할 수 있습니다.
전이 학습의 주요 단계:
- 사전 학습 모델 선정:
- 먼저 대규모 데이터셋에서 학습된 모델을 선택합니다. 예를 들어, 이미지 처리에서는 ImageNet 데이터셋으로 학습된 ResNet, VGG, EfficientNet과 같은 모델을 사용합니다.
- 텍스트 기반의 작업에서는 BERT, GPT, T5 등의 사전 학습된 언어 모델을 사용할 수 있습니다.
- 모델의 일부 고정 또는 미세 조정 (Fine-tuning):
- 선택한 사전 학습 모델의 일부 레이어는 고정하고, 나머지 레이어는 새로운 데이터에 맞춰 재학습(Fine-tuning)할 수 있습니다.
- 소수 클래스 데이터를 포함한 새로운 데이터셋으로 모델의 마지막 몇 개의 레이어를 재학습하여 문제에 특화된 성능을 끌어올립니다.
- Feature Extraction (특징 추출):
- 전이 학습 모델의 초반 레이어는 일반적인 특징을 학습하는데 유리합니다. 따라서 소수 클래스 데이터에서도 유용한 특징을 잘 추출할 수 있습니다.
- 새로운 데이터셋에서 중요한 특징을 추출하여 분류기를 학습하거나 기존 모델에 추가하여 학습할 수 있습니다.
전이 학습의 장점:
- 소량의 데이터만으로도 높은 성능을 얻을 수 있어 소수 클래스 데이터가 적은 상황에서도 유리합니다.
- 모델이 대규모 데이터셋에서 학습한 일반적인 패턴을 그대로 활용하므로, 소수 클래스의 일반화 성능이 높아집니다.
예시:
- 의료 이미지 분류: 일반적인 이미지 분류 모델을 폐 CT 스캔 이미지 분류에 활용하여, 폐 질환(소수 클래스)과 정상 폐(다수 클래스)를 분류하는 데 적용할 수 있습니다.
- 이상 감지: 제조업에서 전이 학습을 사용하여 기계의 이상 소음이나 결함을 탐지할 수 있습니다. 여기서는 소수 클래스인 ‘이상 데이터’가 극히 적기 때문에 전이 학습이 유용합니다.
'Interview > ML' 카테고리의 다른 글
ML Interview - 하이퍼파라미터 튜닝 기법 (0) | 2024.11.10 |
---|---|
ML Interview - IQR (0) | 2024.11.10 |
ML Interview - Z Score (0) | 2024.11.10 |
ML Interview - Anomaly Detection (1) | 2024.11.10 |
ML Interview - 데이터셋의 레이블 불균형 처리 방법안 (0) | 2024.11.10 |