Amazon Rekognition
Rekognition은 이미지와 비디오에서 객체, 얼굴, 텍스트 같은 시각 정보를 바로 추출하는 분석 API입니다. 일반적인 비전 기능을 모델 학습 없이 호출형 서비스로 제공합니다.
▶아키텍처 다이어그램
📊 데이터 흐름 다이어그램점선 애니메이션은 데이터 또는 요청의 흐름 방향을 나타냅니다
이미지에서 텍스트나 얼굴을 뽑고 싶은데 그때마다 데이터셋을 모으고 비전 모델을 학습시키는 건 대부분의 제품에 과합니다. 일반적인 시각 분석조차 직접 모델링해야 하면 기능 하나 붙이는 비용이 지나치게 커집니다.
이미지 분석 기능을 직접 만들려면 수만 장 이상의 학습 데이터 수집, GPU 인프라 구축, 모델 유지보수 비용이 필요합니다. 얼굴 탐지나 텍스트 추출처럼 이미 흔한 기능조차 직접 모델링하려면 수개월의 준비가 필요했고, 전담 ML 엔지니어가 없는 팀에게는 사실상 시작도 어려운 장벽이었습니다. 이 장벽을 없애기 위해 일반적인 시각 분석을 사전 학습 모델 기반으로 API 형태로 제공하는 Rekognition 같은 관리형 서비스가 등장했습니다.
Rekognition은 S3에 저장된 이미지나 직접 전달된 미디어를 분석해 객체, 사람, 텍스트, 장면, 활동, 부적절 콘텐츠 같은 결과를 반환합니다. 얼굴 분석과 얼굴 검색도 지원하고, 결과는 Lambda로 후처리하거나 DynamoDB에 저장하고 SNS로 알릴 수 있습니다.
Rekognition과 커스텀 비전 모델은 둘 다 이미지 분석 문제를 해결하지만 접근 방식이 다릅니다. Rekognition은 얼굴, 텍스트, 객체, 부적절 콘텐츠 같은 범용 카테고리를 인식하도록 사전 훈련된 모델을 API로 제공합니다. 커스텀 모델은 특정 도메인 데이터로 직접 학습한 만큼 해당 영역에서 더 높은 정확도를 낼 수 있지만, 데이터 수집과 학습 비용이 따릅니다. 속도와 범용 정확도가 중요하고 표준적인 시각 분석으로 요건을 충족할 수 있다면 Rekognition이 적합합니다. 도메인 특화 데이터가 있고 일반 모델로는 정확도가 부족하다면 커스텀 모델 학습을 고려해야 합니다.
콘텐츠 태깅, 얼굴 비교, 이미지 검수, 업로드 후 자동 분류, 기본 OCR 성격의 이미지 분석에 적합합니다. 도메인 특화 모델을 직접 학습해야 하는 경우에는 맞지 않습니다.