본문 바로가기
26년2기(4월)

[18] Flow 실습: 그림책을 위한 캐릭터 일관성 유지하기

by seobu 2026. 4. 15.
반응형

AI 기술이 발달하면서 캐릭터 이미지의 일관성을 유지하기 위한 기술도 더불어 발달했는데요, 유료 이미지 제작 툴에서는 초기부터 이런 기능을 제공해 오고 있었습니다. 하지만 무료로 쉽게 쓸 수 있는 툴들, 우리가 많이 쓰는 Gemini, ChatGPT, Copiilot 등과 같은 생성형 AI에서는 구현하기 너무 어려웠습니다.

 

그런데, 생성형 AI의 이미지 생성 기능이 괄목상대할만하게 발전했네요.

제가 며칠 동안 테스트 해보니 엄청나게 좋아졌네요.

 

잠깐 테스트 과정을 살펴볼까요?

 

먼저 휴머노이드 로봇 이미지를 생성했어요.

이 이미지를 생성하기 위해서 아래와 같이 매우 복잡한 프롬프트를 만들었죠.

매우 정교하고 하이퍼 리얼리즘적인 매크로 초상화 세련된 여성형 휴머노이드 자이노이드가 옆모습으로 포착되어 있으며, 깨끗하고 중립적인 회색 스튜디오 배경 앞에 놓여 있다. 스타일은 첨단 프리미엄 로보틱스와 고전적 미학이 결합된 형태이다.

(외골격) 머리 앞과 윗부분, 목, 어깨를 덮는 고광택의 흠잡을 데 없는 흰색 복합 소재 장갑판이 매끄럽게 이어져 있다. 측면 패널에는 사실적으로 조각된 인간과 같은 귀가 통합되어 있다. 얼굴의 보이는 부분은 무광 흰색 마감으로, 고요하고 명상적인 표정, 감긴 혹은 반쯤 감긴 눈, 은은한 푸른빛/자줏빛이 감도는 입술을 지닌다.

(내부 구조) 흰색 장갑판 뒤와 아래에는 복잡하고 밀집된 ‘두뇌’가 드러나 있는데, 정교한 배선, 마이크로 케이블, 묶인 광섬유, 은색 커넥터, 섬세한 기계식 피스톤으로 구성되어 있다. 이 기계적 핵심은 목 아래로 이어지며, 흰색 장갑 같은 목 척추와 쇄골 구조에 의해 둘러싸여 있다.

(조명 및 발광) 장면은 부드럽고 확산된 스튜디오 조명으로 연출된다. 핵심 요소는 생생한 푸른 전기 에너지로, 노출된 내부 배선과 목 척추의 채널을 따라 수많은 작은 밝은 전기 아크, 플라즈마 점, 빛나는 광섬유가 맥동하며 흐른다. 이는 활성화된 데이터 전송과 전력 공급처럼 보여야 한다. 얼굴과 눈은 깊은 눈구멍에서 은은한 내부 푸른빛을 발하며, 입술에도 희미한 푸른빛이 감돈다.

(후면 디테일) 뒤통수 기저부에서 단일의 뚜렷한 관절형 리브드 케이블 도관이 금속 링으로 분절되어 나오며, 부드럽게 뒤로 휘어진다.

(포즈 및 구도) 깨끗한 측면 프로필 뷰(3/4 각도, 대부분 옆모습)로, 머리를 약간 숙여 사색하거나 절전 모드에 들어간 듯한 자세를 취한다. 구도는 유기적 형태에서 기계적 형태로의 정교한 전환에 집중하는 타이트한 초상이다.

(카메라 및 품질) 고해상도 중형 포맷 카메라(예: Phase One)로 촬영. 목 중앙과 내부 배선에 선명한 초점. 배경은 얕은 심도. 8K 해상도, 시네마틱 조명, 사실적인 텍스처(광택 금속, 고무 처리된 배선), 노출된 기계 부품의 믿을 수 없을 만큼 세밀한 디테일. 텍스트나 로고 없음.

 

 

생성형  AI별 출력 결과 비교하기

1. 이 프롬프트를 Gemini, ChatGPT, Copilot에게 각각 입력해 그려달라고 했어요.

Copilot ChatGPT Gemini Flow

 

 

2. "이 휴머노이드 로봇의 전신 이미지를 그려줘"


Copilot ChatGPT Gemini Flow

 

 

3. "이 휴머노이드 로봇의 이름은 Colline이야. Colline 미술렝-스타 레스토랑의 깔끔하고 세련된 주방에서 팬 케이크를 만들고 있는데, 케이크를 위로 띄워 뒤집고 있다. 뒤쪽으로 인간 쉐프 2명이 각자의 요리에 열중하고 있다."

Copilot ChatGPT Gemini Flow

 

 

4. "휴머노이드 로봇 Colline이 봄 기운이 완연한 한강공원을 골든 리트리버 종의 개를 산책 시키고 있다. 멀리 가벼운 운동을 하는 시민들 4~5명이 있고, 주변에 귀여운 말티푸 종의 개를 산책시키는 다른 휴머노이드가 보인다. 봄 기운이 완연한 공원은 평화로워 보인다."

Copilot ChatGPT Gemini Flow 

 

 

5. "휴머노이드 로봇 Colline은 자동차 정비공이야. 깨끗하고 세련된 미래의 자동차 정비공장에서 전기자동차의 자율주행 시스템을 점검하는 모습을 그려줘. 휴머노이드 로봇 Colline은 복잡한 화면이 보이는 태블릿 장치를 보면서 점검하고 있다."

Copilot ChatGPT Gemini Flow

 

 

6. "휴머노이드 로봇 Colline은 휴전선을 지키는 대한민국 육군의 로봇 전사다. Colline과 동료 휴머노이드 로봇 전사들이 저녁 노을이 깔리기 시작하는 휴전선 철책 경계 근무에 투입되기 위해 플라즈마 라이플을 비롯한 장비들을 점검하고 있다. 철책 부근에는 '미인가 접근 시 경고 없이 발포함. 대한민국 육군 로봇여단'이라는 팻말이 보인다."

Copilot ChatGPT Gemini Flow

 

☞ 계속 그려가니까 한계를 보이기 시작합니다. Copilot은 계속 이전 작업의 잔상이 겹치고(핫 케이크, 자동차),  ChatGPT는 그리기 실패가 생기거나 이미지내 한글 표기와 태극기가 엉망입니다. Flow는 디테일은 살아 있는데 결정적으로 캐릭터가 완전히 별개라는 것이 문제입니다. 

 

여기까지 살펴보면, ChatGPT가 가장 우수해 보입니다. 

Copilot도 대단하죠?

Flow는 실망스럽습니다. 장면이 바뀔 때마다 새로운 휴머노이드가 등장해버려요.

 

여기까지만 보면, Copilot과 ChatGPT의 이미지 캐릭터 연속성이 엄청 좋아졌다는 것을 알 수 있어요. 언제부터 이렇게 잘 그려줬는지 알 수 없지만, 얼마 전까지만 해도 상상도 할 수 없는 수준으로 발전했네요. 이렇게 캐릭터를 거의 동일한 수준(자세히 보면 알겠지만 똑같이 그려주지는 못합니다)이라면, Copiot과 ChatGPT로 동화책 쓰기가 가능한 수준에 도달한 것 같은데요, 그럼 Gemini Flow는요?

 

여기서 잠깐 생각해보면 구글 제미나이의 나노바나나가 그렇게 탁월하다는 얘기를 듵어본 기억 나시죠?

그럼, 그런 찬사는 헛소리였을까요? 

 

제미나이에서 캐릭터 일관성 유지에 대해서는, 다음 글에서 살펴보겠습니다.

 

Dual Overview

 

 

Google_Flow_Character_Mastery.pptx
18.88MB

반응형