목록2018/09 (2)
Jeongchul Kim
Finding Similar Items : Locality Sensitive Hashing다음의 게시글은 Stanford University에서 제공하는 Mining of Massive Datasets(http://www.mmds.org)를 이용하여 작성하였습니다. Introduction유사 아이템을 찾는 것은 중요한 기술 중에 하나입니다. 유사한 이미지, 유사한 사용자를 통한 상품 추천, 논문 표절 검사, 유사한 파일 비교 등 많은 분야에서 사용되고 있습니다. 유사한 이미지 검색을 살펴봅시다.바닷가를 전망으로 한 사진과 유사한 이미지를 찾는다면 다음의 과정을 진행합니다. 우선 입력으로 들어가는 사진에 지붕을 삭제합니다. 그리고 유사한 이미지를 20,000 장의 이미지에서 찾아 제일 가까운 10장(nea..
EigenDecomposition 고유값 분해, eigenvectorEigenVector, EigenValue우선 eigenvector 뭔지 살펴봅시다. 선형대수학에서 eigenvector는 선형 변환(linear transformation)을 통해 나온 결과가 자기 자신의 벡터의 상수배를 만족해야 하며, eigenvector는 non-zero(0이 아닌 값) 여야 합니다. 즉 다음의 수식을 만족해야 합니다. Eigenvector의 중요성을 알기 위해서는 기하학적인 측면으로 많이 접근합니다.예를 들어서 컬러 그림(3차원 RGB의 값으로 이루어진 Matrix)을 각도 회전(rotation) 시킨다고 생각을 해봅시다. 이미지 전체를 회전을 하는 경우(선형 변환) 벡터 중에 방향은 보존이 되고 크기(scale..