Google Vertex AI
Google Vertex AI는 머신러닝 모델의 학습, 관리, 서빙을 하나로 묶은 통합 AI 플랫폼입니다. 데이터 준비 이후부터 프로덕션 예측 API까지 이어지는 ML 운영 계층을 제공합니다.
▶아키텍처 다이어그램
🔄 프로세스 다이어그램점선 애니메이션은 데이터 또는 요청의 흐름 방향을 나타냅니다
ML 모델을 프로덕션에 올리려면 학습 인프라, 모델 저장소, 서빙 엔드포인트, 모니터링을 각각 따로 준비해야 합니다. 도구를 분리해서 조합하면 인프라 관리가 ML 자체보다 더 큰 부담이 됩니다.
예전에는 노트북에서 실험하고, 학습용 GPU 서버를 따로 관리하고, Flask로 서빙 서버를 만들어야 했습니다. 이렇게 흩어진 과정을 하나의 플랫폼으로 묶으려는 흐름에서 Vertex AI가 나왔습니다.
Vertex AI는 학습(Training), 모델 저장소(Model Registry), 서빙(Endpoint)을 하나의 흐름으로 묶습니다. AutoML은 데이터를 넣으면 모델을 자동 생성하고, 커스텀 학습은 TensorFlow나 PyTorch 코드를 GPU 클러스터에서 실행합니다. 완성된 모델을 Endpoint에 배포하면 자동 스케일링되는 REST API가 됩니다.
Vertex AI와 BigQuery ML은 둘 다 모델을 학습할 수 있지만 접근 방식이 다릅니다. BigQuery ML은 SQL 안에서 간단한 모델을 다루는 데 초점이 있고, Vertex AI는 대규모 커스텀 학습, AutoML, 모델 서빙까지 전체 ML 라이프사이클을 관리합니다. SQL로 해결되는 수준이면 BigQuery ML, 본격적인 ML 파이프라인이 필요하면 Vertex AI가 맞습니다.
이미지 분류, 텍스트 분류, 수요 예측, 추천, 이상 탐지처럼 데이터를 직접 학습시켜 서비스 맞춤형 모델을 운영할 때 적합합니다. 이미 준비된 모델 호출만으로 끝나거나 학습 파이프라인이 필요 없는 경우에는 과할 수 있습니다.