본 포스팅은 Google Cloud의 'Introduction to Generative AI' 강의 내용을 기반으로 개인 학습 목적으로 정리한 글입니다.
생성형 AI 모델 타입 정리
출처: Introduction to Generative AI - Google Cloud
텍스트 입력 기반 모델 종류
생성형 AI는 입력/출력 데이터 종류에 따라 여러 모델로 나뉨
1. Text to Text
- 자연어 입력 → 텍스트 출력
- 텍스트 쌍 사이의 매핑을 학습
- 대표 예시: 번역 (한국어 → 영어 등)
2. Text to Image
- 텍스트 설명 입력 → 이미지 출력
- 이미지 + 캡션 데이터셋으로 훈련
- 대표 구현 방법: Diffusion(디퓨전)
3. Text to Video / Text to 3D
- Text to Video: 문장 or 스크립트 입력 → 대응하는 비디오 생성
- Text to 3D: 텍스트 설명 → 3D 객체 생성 (게임, 3D 콘텐츠에 활용)
4. Text to Task
- 텍스트 명령 → 특정 작업 직접 수행
- 단순 답변이 아니라 행동을 함
- 할 수 있는 것들:
- 질문 답변
- 웹 검색
- 예측 / 분류
- 웹 UI 탐색
- 문서 직접 수정 (GUI 조작)
Foundation Model (파운데이션 모델)
- 위 개별 모델들보다 훨씬 큰 규모
- 방대한 데이터로 사전 훈련(pre-trained)
- 다양한 태스크에 파인튜닝(fine-tuning) 가능
쓸 수 있는 분야:
- 감성 분석, 이미지 캡셔닝, 객체 인식
- 사기 탐지, 개인화 고객 지원
혁신 기대 산업: 의료 / 금융 / 고객 서비스
Google Vertex AI - Model Garden
카테고리포함 모델
| 언어(Language) | Chat, Text, Code |
| 비전(Vision) | Stable Diffusion 등 |
태스크 특화 모델 예시
- 고객 감성 분석 → Sentiment Analysis 모델
- 공간 점유율 분석 → Occupancy Analytics 모델
핵심 정리
텍스트 입력 → 출력 종류에 따라 모델이 달라짐
Text to Text / Image / Video / 3D / Task
파운데이션 모델 = 대형 사전훈련 모델 → 다양한 태스크에 파인튜닝 가능
'AI' 카테고리의 다른 글
| Introduction to Generative AI — 추가 읽기 자료 정리 (0) | 2026.05.20 |
|---|---|
| google skills | Google Cloud 생성형 AI 도구 3가지 정리 (0) | 2026.05.20 |