AI 이미지 생성의 진화, 구글 제미나이가 제시하는 새로운 가능성

허양 기자

yheo@fransight.kr | 2025-09-12 09:30:46

기자 직접 체험기: "몇 번의 대화로 완벽한 이미지가 탄생했다" 제미나이가 생성한 사무실 이미지 최종본

[프랜사이트 = 특별취재팀 허양 기자] 

AI 분야에서 후발주자로 여겨졌던 구글이 추격의 칼날을 빼들었다. 생성형 AI '제미나이(Gemini)'에 탑재된 이미지 생성 기능이 그 중심에 있다. 기자가 직접 체험해본 제미나이의 이미지 생성 능력은 놀라웠다.

대화형 수정의 혁신, "이것만 바꿔줘"가 현실이 되다
체험 과정은 단순한 텍스트 명령으로 시작됐다. "노트북 컴퓨터를 사용하는 사무실에 남여 각 2명의  젊은 한국인 직원들이 40대 초반으로 보이는 남자 리더가 서서 이야기하는 모습을 밝은 모습으로 바라보고 있는 이미지를 인터넷 기사용 가로형태로 만들어줘."

첫 번째 결과물이 나오자, 기자는 바로 추가 요청을 했다. "셔츠 색깔과 표정, 그리고 손모양 등 젊은 직원들의 모습에 변화를 주면 좋겠어." 제미나이는 즉시 수정된 이미지를 생성했다. 마치 전문 디자이너와 대화하듯 자연스러운 과정이었다.

이어 "앉아있는 남자와 노랑 셔츠를 입은 여자의 위치를 바꿔줘"라는 요청에도 정확히 응답했다. 가장 인상적이었던 순간은 "벽에 프랜사이트 로고를 추가해줘"라는 명령 후, 특정 로고 이미지를 업로드하며 "로고는 이걸로 사용하고 벽의 기둥은 피해서 올려줘"라고 세밀한 주문을 했을 때였다. 제미나이는 이 복잡한 요구사항을 완벽하게 반영한 최종 이미지를 완성했다.

제미나이는 대화형 프롬프트로 이미지를 개선해 나갔다. AI생성 이미지

제미나이만의 차별화된 기능들
구글 제미나이의 이미지 생성 기능은 단순한 텍스트-이미지 변환을 넘어선다. 텍스트, 이미지 또는 둘 다를 조합해 프롬프트를 제공하여 전례 없는 제어 기능을 통해 시각적 요소를 만들고, 수정하고, 반복할 수 있다.

주요 기능으로는 ▲텍스트-이미지 생성(간단하거나 복잡한 텍스트 설명에서 고품질 이미지 생성) ▲이미지+텍스트-이미지 수정(기존 이미지에 요소 추가, 삭제, 수정이나 스타일 변경, 색 보정 조정) ▲다중 이미지 구성(여러 입력 이미지로 새 장면 구성이나 스타일 전이) ▲반복적 수정(대화를 통한 점진적 이미지 완성) ▲고화질 텍스트 렌더링(로고, 다이어그램, 포스터용 가독성 있는 텍스트 포함 이미지) 등이 있다.

경쟁 격화되는 AI 이미지 생성 시장
제미나이의 등장으로 AI 이미지 생성 시장의 경쟁은 더욱 치열해졌다. 현재 시장을 주도하고 있는 서비스들을 살펴보면 각각의 특색이 뚜렷하다.

OpenAI DALL-E 3
오픈AI의 달리 3는 현재 챗GPT 플러스 및 기업 고객에게 API를 통해 제공되고 있으며, 챗GPT와의 통합을 통해 프롬프트 작성의 편의성을 크게 향상시켰다. ChatGPT 4 또는 4o 사용 시 프롬프트당 하나의 이미지가 생성되고, DALL-E 3 GPT 모델은 프롬프트당 두 개의 이미지를 제공한다.

미드저니(Midjourney)
미드저니는 높은 예술성과 창의적인 이미지 생성에 강점을 가진 서비스로, 텍스트 프롬프트 기반 이미지 생성, 다양한 아트 스타일 구현, 이미지 변형 및 확장 기능을 제공한다. 특히 예술적 품질 면에서 높은 평가를 받고 있다.

기타 서비스들
이 외에도 어도비의 파이어플라이(Firefly), 스테이빌리티 AI의 스테이블 디퓨전(Stable Diffusion) 등 다양한 서비스들이 각자의 장점을 내세우며 시장 점유율 확대에 나서고 있다.

비즈니스 활용도 확산
ChatGPT는 DALL-E 3를 통한 이미지 생성 기능을 갖추고 있으며, Gemini는 Google 생태계와의 연동을 통해 리서치 기반 콘텐츠 생성에 유리하다. 이러한 특성으로 인해 마케팅, 광고, 콘텐츠 제작 등 다양한 비즈니스 영역에서 활용도가 급속히 늘고 있다. 특히 제미나이의 경우 구글의 맞춤형 버전인 젬스(Gems)와 새로운 이미지 생성 모델인 이마젠 3(Imagen 3)이 제미나이 어드밴스드, 비즈니스, 엔터프라이즈 모두에서 사용 가능해 기업 고객들의 관심을 끌고 있다.

소상공인 마케팅의 민주화

기자의 체험 결과, 제미나이의 가장 큰 강점은 '대화형 수정' 능력이었다. 기존 서비스들이 주로 일회성 생성에 집중했다면, 제미나이는 사용자와의 자연스러운 대화를 통해 이미지를 점진적으로 완성해 나가는 방식을 제시했다.

이는 전문 디자인 지식이 없는 일반 사용자도 원하는 결과물을 얻을 수 있게 해주는 중요한 진전이다. 특히 프랜차이즈 가맹점주나 소규모 자영업자들에게는 '마케팅의 민주화'라고 부를 만한 변화다. 대기업만이 누릴 수 있던 전문적인 마케팅 소재 제작이 이제 누구에게나 열린 기회가 된 것이다.

업계 전문가들은 이런 변화가 소상공인들의 경쟁력 향상에 크게 기여할 것으로 전망하고 있다. 한국프랜차이즈협회 관계자는 "AI 이미지 생성 기술이 가맹점주들의 마케팅 역량을 크게 끌어올릴 것"이라며 "특히 이런 기술적 도구는 소상공인들에게 큰 도움이 될 것"이라고 말했다.

앞으로 AI 이미지 생성 시장은 단순한 품질 경쟁을 넘어 사용자 경험, 접근성, 그리고 창작 과정에서의 협업 능력을 중심으로 재편될 것으로 전망된다. 특히 소규모 사업자들을 위한 맞춤형 템플릿이나 업종별 특화 기능들이 더욱 발달할 것으로 예상된다. 구글 제미나이의 이번 행보는 그 변화의 서막을 알리는 신호탄이 될 것으로 보인다.

이 기사는 기자가 직접 구글 제미나이 이미지 생성 기능을 체험한 내용을 바탕으로 작성되었습니다.

[ⓒ 프랜사이트 (FranSight). 무단전재-재배포 금지]

WEEKLY HOT