AI

google skills | 생성형 AI 모델 타입 정리

AM0530 2026. 5. 20. 23:08

본 포스팅은 Google Cloud의 'Introduction to Generative AI' 강의 내용을 기반으로 개인 학습 목적으로 정리한 글입니다.

생성형 AI 모델 타입 정리

출처: Introduction to Generative AI - Google Cloud


텍스트 입력 기반 모델 종류

생성형 AI는 입력/출력 데이터 종류에 따라 여러 모델로 나뉨


1. Text to Text

  • 자연어 입력 → 텍스트 출력
  • 텍스트 쌍 사이의 매핑을 학습
  • 대표 예시: 번역 (한국어 → 영어 등)

2. Text to Image

  • 텍스트 설명 입력 → 이미지 출력
  • 이미지 + 캡션 데이터셋으로 훈련
  • 대표 구현 방법: Diffusion(디퓨전)

3. Text to Video / Text to 3D

  • Text to Video: 문장 or 스크립트 입력 → 대응하는 비디오 생성
  • Text to 3D: 텍스트 설명 → 3D 객체 생성 (게임, 3D 콘텐츠에 활용)

4. Text to Task

  • 텍스트 명령 → 특정 작업 직접 수행
  • 단순 답변이 아니라 행동을 함
  • 할 수 있는 것들:
    • 질문 답변
    • 웹 검색
    • 예측 / 분류
    • 웹 UI 탐색
    • 문서 직접 수정 (GUI 조작)

Foundation Model (파운데이션 모델)

  • 위 개별 모델들보다 훨씬 큰 규모
  • 방대한 데이터로 사전 훈련(pre-trained)
  • 다양한 태스크에 파인튜닝(fine-tuning) 가능

쓸 수 있는 분야:

  • 감성 분석, 이미지 캡셔닝, 객체 인식
  • 사기 탐지, 개인화 고객 지원

혁신 기대 산업: 의료 / 금융 / 고객 서비스


Google Vertex AI - Model Garden

카테고리포함 모델

언어(Language) Chat, Text, Code
비전(Vision) Stable Diffusion 등

태스크 특화 모델 예시

  • 고객 감성 분석 → Sentiment Analysis 모델
  • 공간 점유율 분석 → Occupancy Analytics 모델

핵심 정리

텍스트 입력 → 출력 종류에 따라 모델이 달라짐
Text to Text / Image / Video / 3D / Task

파운데이션 모델 = 대형 사전훈련 모델 → 다양한 태스크에 파인튜닝 가능