NVIDIA DGX
·
Interview/ML
NVIDIA DGXDGX 시스템은 NVIDIA가 개발한 고성능 AI 전용 서버로, 대규모 딥러닝 모델의 학습과 추론을 위해 설계된 컴퓨팅 장치입니다. DGX 시스템은 여러 개의 강력한 GPU, 고속 인터커넥트, 대용량 메모리, 그리고 딥러닝에 최적화된 소프트웨어 스택을 포함하고 있어, AI 연구와 고성능 컴퓨팅(HPC)에 필요한 연산 성능을 제공합니다. 주로 AI 연구소, 데이터 센터, 기업에서 GPT-4와 같은 대형 AI 모델의 훈련 및 배포에 사용됩니다.DGX 시스템의 주요 특징강력한 GPU 아키텍처DGX 시스템은 최신의 강력한 NVIDIA GPU(A100, H100 등)를 여러 개 탑재하여 높은 연산 성능을 제공합니다. 예를 들어, DGX A100에는 8개의 NVIDIA A100 GPU가 포함되어 ..
ML Interview - 딥러닝의 장점과 단점
·
Interview/ML
[ML/DL] 딥러닝의 장점과 단점?딥러닝의 장점과 단점을 설명해보자면 다음과 같습니다.장점고성능 데이터 분석: 딥러닝은 대규모 데이터셋을 처리하고 학습할 수 있어, 이미지 인식, 음성 인식, 자연어 처리 등 다양한 분야에서 탁월한 성능을 발휘합니다. 기존의 머신러닝 모델보다 복잡한 패턴을 인식하는 데 뛰어납니다.특징 추출 자동화: 전통적인 머신러닝에서는 중요한 특징을 사람이 정의해야 했지만, 딥러닝은 데이터에서 자동으로 유용한 특징을 추출합니다. 이를 통해 더 높은 수준의 예측 성능을 이끌어낼 수 있습니다.확장 가능성: 딥러닝은 대규모 데이터셋과 더 많은 연산 자원을 사용할수록 성능이 개선되는 특성이 있어, 모델을 고도화하거나 새로운 애플리케이션에 확장하기에 적합합니다.다양한 응용 가능성: 컴퓨터 비전..
ML Interview - Cross Validation
·
Interview/ML
Cross Validation교차 검증(Cross Validation)은 머신러닝에서 모델의 성능을 평가하는 방법 중 하나로, 주어진 데이터를 여러 번 나누어 모델을 학습하고 검증하는 방식입니다. 데이터를 여러 번 나누어 검증하기 때문에 모델의 일반화 성능을 더 정확하게 평가할 수 있는 장점이 있습니다.  K-Fold Cross Validation가장 일반적인 방법인 K-폴드 교차 검증(K-Fold Cross Validation)을 예로 들면, 다음과 같은 과정으로 진행됩니다:데이터 분할: 데이터를 K개의 폴드(fold)로 나눕니다.학습 및 검증 반복: 각 폴드에 대해, K개의 폴드 중 하나의 폴드를 검증 세트로, 나머지 K-1개의 폴드를 학습 세트로 사용하여 모델을 학습하고 평가합니다.평균 성능 계산:..
ML Interview - 모델 추론 실시간 서빙 시스템
·
Interview/ML
ML 모델 추론 실시간 서빙 시스템ML 모델을 실시간 요청에 대응하도록 만들기 위해서는 빠르고 안정적인 응답이 가능하도록 모델 설계, 최적화, 서빙 인프라 설계가 중요합니다. 주요 단계를 다음과 같이 정리할 수 있습니다:1. 모델 경량화 및 최적화모델 크기 축소: 실시간 응답 속도를 높이기 위해 모델을 경량화합니다. 이를 위해 지연 응답이 큰 복잡한 모델은 경량 모델로 대체하거나, 필요한 경우 트리머나 프루닝(Pruning), 양자화(Quantization), 지연된 레이어 제거 등의 기술을 적용합니다.임베딩 캐싱: 특히 NLP나 추천 시스템에서 임베딩을 사용하는 경우, 주요 단어 또는 아이템에 대한 임베딩을 캐시에 저장하여 실시간 조회 속도를 높입니다.지연 최적화: 모델이 응답 속도가 중요한 경우 Te..
ML Interview - 추천 시스템의 고수준 설계
·
Interview/ML
추천 시스템의 고수준 설계추천 시스템의 고수준 설계는 사용자가 선호할 가능성이 높은 아이템(예: 상품, 콘텐츠, 친구)을 제안하기 위한 구조를 만드는 것입니다. 주요 요소와 구성 요소는 다음과 같습니다:1. 데이터 수집사용자 데이터: 사용자 프로필 정보(나이, 성별, 위치 등), 행동 데이터(클릭, 좋아요, 구매 내역 등), 평점 데이터 등이 포함됩니다.아이템 데이터: 추천할 대상(예: 상품, 콘텐츠)에 대한 메타데이터입니다. 영화 추천 시스템에서는 장르, 감독, 배우 등이 포함될 수 있습니다.환경 데이터: 사용자가 접속한 시간대, 위치, 기기 등의 맥락 정보도 수집할 수 있습니다.2. 데이터 전처리데이터 품질을 높이기 위해 결측값 처리, 중복 제거, 정규화 등의 작업을 수행합니다.추천 시스템에서는 아이..
ML Interview - Normalization
·
Interview/ML
ML에서 정규화 방법ML에서 정규화는 데이터의 분포를 조정하여 모델 학습을 더 쉽게 하고, 모델의 성능을 높이는 중요한 전처리 과정입니다. 정규화는 주로 입력 데이터의 범위를 조정하여 학습 속도를 향상시키고, 과적합을 방지하며, 예측 성능을 개선하기 위해 사용됩니다. 대표적인 정규화 방식은 Min-Max 정규화와 Z-정규화 (표준화)가 있습니다.1. Min-Max 정규화Min-Max 정규화는 데이터의 범위를 [0, 1] 또는 [-1, 1] 사이의 값으로 조정하는 방식입니다. 각 데이터 값을 해당 변수의 최솟값과 최댓값을 사용하여 다음과 같이 변환합니다.장점: Min-Max 정규화는 데이터의 최대 및 최소 값이 모두 중요한 경우에 효과적이며, 특히 신경망 등에서 활성화 함수의 범위에 맞추어 입력 데이터를 ..
ML Interview - Evolutionary Algorithms
·
Interview/ML
Evolutionary Algorithms진화 알고리즘(Evolutionary Algorithms)은 생물의 진화 과정을 모방하여 하이퍼파라미터 최적화를 수행하는 방법입니다. 특히 하이퍼파라미터 공간이 넓거나 복잡한 경우에 유용하게 사용할 수 있는 방법으로, 유전 알고리즘(Genetic Algorithm)을 대표적인 기법으로 포함합니다. 이 알고리즘은 집단(Population) 내에서 개체(Individuals)를 선택하고, 교배(Crossover) 및 변이(Mutation)를 통해 점진적으로 최적의 하이퍼파라미터 조합을 찾아갑니다.   진화 알고리즘의 주요 개념개체 (Individual)각 개체는 특정 하이퍼파라미터 조합으로 정의되며, 진화 알고리즘에서는 이를 하나의 해(solution)로 취급합니다...
ML Interview - Bayesian Optimization
·
Interview/ML
Bayesian Optimization베이즈 최적화(Bayesian Optimization)는 함수 평가에 높은 비용이 드는 상황에서 최적의 하이퍼파라미터 조합을 효율적으로 찾기 위해 고안된 최적화 방법입니다. 일반적으로 하이퍼파라미터 튜닝에서 자주 사용되며, 평가 횟수를 줄이면서도 성능을 최적화할 수 있다는 장점이 있습니다.  베이즈 최적화의 주요 개념목적 함수 (Objective Function)베이즈 최적화는 우리가 최적화하고자 하는 목적 함수, 즉 하이퍼파라미터 조합에 따른 모델 성능을 평가하는 함수가 필요합니다.이 목적 함수는 모델의 성능 평가에 큰 비용이 들기 때문에, 최소한의 평가 횟수로 최적의 결과를 찾는 것이 목표입니다.확률 모델 (Surrogate Model)베이즈 최적화에서는 목적 함..
김 정출
'Interview/ML' 카테고리의 글 목록