AI 추론은 학습된 머신러닝 모델로 학습된 패턴을 적용하여 처음 접하는 새로운 데이터로 예측을 수행하는 프로세스입니다. 이 과정은 Cloud Run에 AI 추론 서비스를 빠르게 배포하는 데 관심이 있는 개발자, 데이터 과학자, ML 엔지니어를 대상으로 설계되었습니다. 클라우드 기반 서버리스 애플리케이션 배포 솔루션에는 익숙하지만 Google Cloud 서버리스 제품을 사용하여 AI 추론을 실행해 본 경험이 없는 사용자에게 유용한 과정입니다. 이 과정에는 GPU를 사용해 AI 추론 모델을 배포하고 생성형 AI 앱을 데이터 스토리지 서비스와 통합하는 예시가 포함되어 있습니다.
이 과정에서는 Google Cloud의 생성형 AI 기반 파트너인 Gemini가 Google 제품 및 서비스를 사용해 애플리케이션을 개발, 테스트, 배포, 관리하는 데 어떤 도움이 되는지 알아봅니다. Gemini의 도움을 받아 웹 애플리케이션을 개발 및 빌드하고, 애플리케이션의 오류를 수정하고, 테스트를 개발하고, 데이터를 쿼리하는 방법을 배웁니다. 실무형 실습을 통해 Gemini로 소프트웨어 개발 수명 주기(SDLC)가 얼마나 개선되는지 경험할 수 있습니다. Duet AI의 이름이 Google의 차세대 모델인 Gemini로 변경되었습니다.
이 과정에서는 생성형 AI 모델을 배포하고 관리할 때 MLOps팀이 직면하는 고유한 과제를 파악하는 데 필요한 지식과 도구를 제공하고 Vertex AI가 어떻게 AI팀이 MLOps 프로세스를 간소화하고 생성형 AI 프로젝트에서 성공을 거둘 수 있도록 지원하는지 살펴봅니다.