Gemini Omni 사용법, 대화로 영상을 편집하는 구글의 새 AI 모델

밸런스 UP
17시간 전
조회수
75

영상을 편집하기 위해 영상 편집 툴을 사용하고  있습니다.

2026년 5월 19일 구글 I/O 2026에서 Gemini Omni Flash가 공개됐습니다. 제미나이의 방대한 현실 세계 지식에 영상 생성 모델 Veo, 이미지 생성 · 편집 모델 Nano Banana, 생성형 시뮬레이션 모델 Genie를 하나로 결합해, 중력·유체 역학 같은 물리 법칙을 이해하는 수준의 영상 출력을 제공합니다.

기존 텍스트 to Video 방식의 영상 제작을 넘어, 사용자와 나누는 대화를 통해 세밀한 부분을 수정해주는 대화형 영상 편집 기술이 핵심입니다. 

구글 내부에서도 ‘영상판 Nano Banana’라고 부를 정도로, 이미지 편집에서 Nano Banana가 만들어낸 변화를 영상 영역에서 재현하겠다는 방향성이 분명합니다.

이 글에서는 Gemini Omni가 어떤 모델인지, 기존 영상 생성 AI와 무엇이 다른지, 그리고 마케터·콘텐츠 크리에이터·IT 프리랜서가 실제 업무에서 어떻게 활용할 수 있는지를 중심으로 정리합니다.

 

Gemini Omni 핵심 요약

  • 멀티모달 All-in-One: 텍스트·이미지·오디오·영상을 한꺼번에 입력해 고품질 영상을 출력합니다. 별도 편집 소프트웨어 없이 하나의 채팅 인터페이스에서 생성과 편집을 모두 처리할 수 있습니다.
  • 대화형 편집 루프: "씬을 야경으로 바꿔줘"처럼 자연어 지시만으로 영상을 수정할 수 있습니다. 각 지시는 이전 편집 결과 위에 누적되어, 현재 출시된 AI 영상 도구 중 실제 프로덕션 흐름에 가장 가까운 워크플로우를 구현합니다.
  • YouTube Shorts 무료 접근: YouTube Shorts·YouTube Create 앱 사용자라면 별도 구독 없이 Gemini Omni Flash를 무료로 이용할 수 있습니다. Google AI Pro($19.99/월) 이상 구독자에게는 더 높은 사용 한도가 제공됩니다.
  • SynthID 투명성 보장: 모든 생성 영상에 구글 DeepMind의 SynthID 보이지 않는 워터마크와 C2PA 콘텐츠 자격 증명이 자동 포함되어, AI 생성물임을 언제든 확인할 수 있습니다.

 

Gemini Omni란?

Gemini Omni에 대해 설명했습니다.

Gemini Omni는 구글이 2026년 5월 19일 구글 I/O 2026 키노트에서 공개한 통합 멀티모달 AI 모델입니다. "어떤 입력에서든 어떤 출력 형식으로든 생성한다(Create anything from any input)"는 비전 아래, Gemini와 영상 생성 모델 Veo, 이미지 편집 모델 Nano Banana, 생성형 시뮬레이션 모델 Genie를 하나의 시스템으로 결합했습니다. 

단순히 프롬프트로 영상을 뽑아내는 것이 아니라, 사용자와 대화를 이어가며 결과물을 다듬는 편집 파트너 역할로 설계돼 세심한 수정까지 가능합니다. 

Gemini 앱 · Google Flow · YouTube Shorts · YouTube Create까지 연동돼 활용 환경도 폭넓게 갖춰 AI 영상 제작 경험을 한 단계 끌어올릴 모델로 주목받고 있습니다.

 

Gemini Omni, 

다른 영상 AI와 무엇이 다를까?

 

1. 대화형 편집으로 실제 프로덕션 흐름을 구현합니다

Gemini Omni는 텍스트 · 이미지 · 오디오 · 영상, 네 가지 입력을 동시에 하나의 맥락으로 처리하는 통합형 영상 생성 · 편집 모델로 사용자와 대화를 통한 세밀한 수정을 지원합니다.

기존 영상 생성 AI는 원하는 장면이 나오지 않으면 프롬프트를 처음부터 다시 작성해야 했습니다. 수정을 반복할수록 캐릭터 얼굴 · 배경 색감이 달라지는 일관성 문제도 빈번했습니다.

Gemini Omni는 매 수정마다 이전 영상의 캐릭터 · 배경 · 움직임 정보를 유지하면서 장면을 변형합니다.  프롬프트를 다시 쓰는 대신 대화로 결과물을 좁혀가는 방식으로, 실제 편집 현장의 피드백 루프에 가장 가까운 구조로 사용자가 원하는 최적의 영상을 생성합니다.

 

2. 멀티모달 입력으로 참고 자료를 그대로 활용합니다

Gemini Omni는 텍스트 · 이미지 · 오디오 · 영상, 네 가지 입력을 동시에 하나의 맥락으로 처리하는 통합형 영상 생성·편집 모델입니다. 

기존 영상 AI도 이미지나 영상을 입력받는 기능은 갖추고 있습니다. 다만 이 네 가지를 동시에 넣고 하나의 결과물로 이어주는 방식은 달랐습니다. 

Gemini Omni는 레퍼런스 이미지, 음성 메모, 기존 영상 클립을 한꺼번에 업로드한 뒤 "이 이미지 분위기를 유지하면서 제품을 소개하는 10초 영상을 만들어줘"처럼 복합 입력을 하나의 맥락으로 처리합니다. 

별도의 편집 소프트웨어나 중간 변환 작업 없이, 하나의 채팅 인터페이스에서 생성과 편집을 완성합니다.

 

3. 물리 법칙 기반 사실감으로 리얼리티를 높입니다

Gemini Omni는 중력, 운동 에너지, 유체 역학 같은 물리 현상에 대한 이해도가 기존 모델보다 한층 강화됐습니다. 

다른 영상 생성 모델에서 종종 발생하는 '물이 어색하게 흐르거나 인물 손가락이 비자연스럽게 움직이는' 물리적 오류가 눈에 띄게 줄었습니다. 

덕분에 제품 시연 영상이나 교육 콘텐츠처럼 현실감이 중요한 제작물에서 디테일한 부분까지 자연스럽게 표현됩니다.

 

Gemini Omni 사용법

Gemini Omni는 현재 AI Plus 이상 구독자에 한해 Gemini 앱과 Google Flow에서 Flesh 버전으로 사용 가능합니다. 

YouTube Shorts·YouTube Create App은 순차적으로 공개 계획을 가지고 있습니다. Gemini Omni를 사용하기 위해 Flow에 접속해 로그인 합니다.

 

Flow에서 동영상을 생성하기 위해 Omni Fresh를 설정했습니다.

Google Flow 대화창에서 프롬프트 입력 전 설정 팝업을 열면 출력 형식을 선택할 수 있습니다. 동영상을 선택한 뒤 Omni Flash 모델을 지정하면 영상 생성이 가능합니다.

4초부터 10초까지 길이를 선택할 수 있고, 같은 조건으로 한 번에 1~4개의 영상을 동시에 생성할 수 있습니다.

세로형(9:16)과 가로형(16:9) 두 가지 비율을 지원합니다. YouTube Shorts나 모바일 콘텐츠라면 9:16, 유튜브 본편이나 프레젠테이션용이라면 16:9를 선택하면 됩니다.

 

Omni Fresh를 사용해 영상 생성하기

Omni Fresh는 영상을 구현하는 물리력이 업데이트되어 사실과 같은 영상을 생성합니다. 예시를 들기 위해 카페에서 일하면서 커피를 마시는 영상을 제작해보겠습니다. 프롬프트는 아래와 같이 입력했습니다.

 

프롬프트 예시

"도심 카페 테라스에서 노트북으로 일하는 30대 여성. 따뜻한 오후 햇살, 커피잔 옆에 스마트폰. 자연스러운 시선 이동. 10초, 가로 16:9 비율."

 

Flow에서 Gemini Omni를 활용해 카페에 있는 여성의 영상을 생성했습니다.

요청한 대로 카페에서 일하는 여성의 모습이로 10초 영상이 생성되었습니다.

 

Gemini Omni로 생성한 영상입니다. 프롬프트에 입력한 그대로 생성되었습니다.

프레임 전환을 별도로 지시하지 않아도 구도가 자연스럽게 바뀌며 10초를 채우는 영상이 생성됩니다. 외부 소음, 노트북 타자 소리, 스마트폰 알림음 같은 주변 환경음도 별도 설정 없이 영상에 자연스럽게 담깁니다. 

 

영상 내 배경과 디테일 수정하기

Gemini Omni가 주목받는 이유는 기존 영상을 유지하면서 디테일을 수정하는 기능 때문입니다. 배경이나 의상 색상을 바꾸거나 음성을 자연스럽게 추가하는 작업이 하나의 대화 흐름 안에서 처리됩니다. 실제로 어떻게 동작하는지 아래 프롬프트로 직접 테스트해봤습니다.

 

프롬프트 예시

"배경 카페를 더 아늑한 분위기로 바꿔줘. 조명은 따뜻한 노란빛으로."

"여성의 머리카락 색상을 검정색으로 변경해줘"

 

Gemini Omni에서 생성된 영상의 머리카락 생상과 배경 분위를 변경한 ai 영상 움짤입니다.

기존 영상은 그대로 유지되면서 프롬프트에서 요청한 캐릭터의 머리카락 색상과 배경만 바뀐 것을 확인할 수 있습니다. 

 

포스터 이미지를 사용해 홍보 영상 만들기

Gemini Omni는 Gemini 3.5의 추론 기능을 포함해 영상을 제작합니다. 덕분에 기존의 이미지나 영상에 이어서 자연스러운 영상을 생성합니다. 이를 활용하면 기존 제품 이미지와 이어진 마케팅용 홍보 영상이나 숏츠 영상을 생성할 수 있습니다. 

 

image 2.0으로 만든 한라봉 포스터입니다.

* 이미지 출처: Image 2.0 노하우 총정리 - 이랜서 블로그

기존에 Images 2.0의 기능을 리뷰할 때 생성한 포스터에 이은 홍보 영상을 제작해보겠습니다. 프롬프트는 아래와 같습니다. 

 

프롬프트 예시

첨부한 이미지를 첫 프레임으로 사용해 16:9 비율의 10초 광고 영상을 생성해줘. 영상은 첨부 이미지 그대로의 정지 화면에서 시작한다. 텍스트와 배경 그래픽이 그대로 있는 포스터 상태에서, 그 안의 여성이 사진 속 인물에서 실제로 살아 움직이는 인물로 자연스럽게 전환된다.

시작: 첨부 이미지의 포스터 화면이 그대로 보인다. 한라봉을 들고 엄지손가락을 올린 여성이 사진처럼 멈춰 있다.

전환: 멈춰 있던 여성이 눈을 깜빡이고 숨을 쉬며 살아 움직이기 시작한다. 한라봉을 카메라 쪽으로 살짝 들어 올려 천천히 한 바퀴 돌려 보여준다. 햇빛에 한라봉 표면의 오돌토돌한 질감과 윤기가 반짝인다. 카메라는 여성의 얼굴에서 한라봉으로 부드럽게 푸시 인했다가 다시 천천히 빠진다. 배경의 제주 바다와 오름, 귤밭은 산들바람에 잎이 흔들리며 생동감 있게 움직인다.

마무리: 여성이 다시 한라봉을 든 채 엄지손가락을 올리고 환하게 웃는 자세로 돌아와 끝난다.

여성이 밝고 경쾌한 한국어로 말한다: "제주 한라봉, 기가 막히네~ 최고예요!" 전환 이후 구간에서 한 번 말하고, 마지막 엄지손가락 장면에서 "최고예요!"가 강조되도록 립싱크 타이밍을 맞춘다.

배경음악은 통통 튀는 우쿨렐레 기반의 밝은 여름 멜로디로, 대사가 또렷이 들리도록 낮게 깐다. 외부 환경음으로 잔잔한 파도 소리와 새소리를 옅게 더한다.

전체 톤은 상큼하고 경쾌한 여름 햇살 분위기, 밝고 채도 높은 색감으로 유지한다.

 

https://youtu.be/CsNdDWkhmcg

프롬프트에서 요청한 대로 영상이 생성됐습니다. 첨부 이미지에서 시작해 인물이 자연스럽게 움직이다가 다시 첨부 이미지와 같은 장면으로 끝나는 흐름이 그대로 구현됐습니다. 배경음악과 대사도 영상에 맞춰 자연스럽게 들어갔습니다.

포스터 한 장만 있으면 제품 홍보 영상이나 숏츠를 빠르게 제작해 업로드까지 이어갈 수 있어, 콘텐츠 제작 속도가 중요한 마케터와 크리에이터라면 유용하게 활용할 수 있습니다.

 

Gemini Omni, 실무에서는 이렇게 활용하세요

Gemini Omni의 활용 노하우를 설명했습니다.

 

마케터: 레퍼런스를 그대로 영상으로

브랜드 가이드 이미지, 제품 사진, BGM 파일을 한꺼번에 업로드한 뒤 "이 분위기로 10초 제품 소개 영상 만들어줘"라는 한 줄의 지시만으로 초안을 생성할 수 있습니다.

이후 "배경 색감을 좀 더 따뜻하게", "로고 위치를 오른쪽 하단으로"처럼 대화로 수정하면 되기 때문에, 외부 제작사에 맡기거나 편집 툴을 익히는 데 들이던 시간을 줄일 수 있습니다.

제품 시연 영상처럼 물리적 사실감이 중요한 콘텐츠에서도 완성도가 높은 영상을 생성할 수 있어, 고객들의 관심을 끌고 궁금증을 해소하는 마케팅용 영상으로 유용하게 활용할 수 있습니다.

 

콘텐츠 크리에이터: YouTube Shorts 제작을 무료로

Gemini Omni Flash는 YouTube Shorts와 YouTube Create App에서 무료로 제공됩니다. 

직접 촬영한 클립을 올리고 "이 장면의 배경을 우주로 바꿔줘", "여기서 조명을 더 드라마틱하게"처럼 지시하면 원본 클립의 인물과 움직임은 유지하면서 장면이 바뀝니다. 아바타 기능을 쓰면 본인의 얼굴과 목소리를 학습시킨 디지털 캐릭터가 영상에 등장합니다.

직접 카메라 앞에 서지 않아도 본인처럼 보이고 들리는 영상을 만들 수 있어, 상황과 필요에 맞춰 유연하게 활용할 수 있습니다. 

 

IT 프리랜서: 클라이언트 납품 영상의 품질을 높이는 도구로

교육 콘텐츠, 서비스 소개 영상, 인터랙티브 데모처럼 설명이 중심이 되는 영상에서 활용도가 높습니다. 클라이언트가 제공한 텍스트 기획안, 참고 이미지, 음성 메모를 동시에 입력해 초안을 뽑고, 피드백을 대화로 반영하는 방식으로 수정 횟수를 줄일 수 있습니다. 개발자 · 기업 대상 API는 몇 주 내 공개 예정으로, 자체 서비스나 자동화 파이프라인에 직접 연동하는 것도 가능해집니다.

 

Gemini Omni 사용 시 주의사항

Gemini Omni의 주의사항에 대해 설명했습니다.

 

1. 생성된 영상을 그대로 믿지 말고 반드시 검증해야 합니다

현재 Omni Flash의 결과물 품질은 입력 프롬프트의 구체성과 참고 이미지 품질에 크게 좌우됩니다. 물리 법칙 이해도가 향상되었지만, 여전히 손가락 개수가 잘못 표현되거나 텍스트가 흐릿하게 나타나는 오류가 발생할 수 있습니다. 

인물 얼굴의 세부 표현이나 특정 브랜드 로고가 포함된 영상은 생성 후 반드시 프레임 단위로 확인해야 합니다. 

 

2. 상업적 사용 시 저작권을 반드시 확인해야 합니다

모든 Gemini Omni 출력 영상에는 구글 DeepMind의 SynthID 보이지 않는 워터마크가 자동 삽입됩니다. 이 워터마크는 생성 과정 자체에 내재되어 있어 제거가 불가능합니다. 

상업용 영상으로 활용할 경우 구글의 Gemini 이용약관을 반드시 확인하고, 영상 안에 등장하는 인물 · 배경의 초상권과 저작권은 사용자가 직접 해결해야 합니다.

 

3. 오디오 편집 기능은 현재 버전에서 제공되지 않습니다

Gemini Omni Flash 첫 번째 버전에는 기존 영상의 음성을 수정하거나 교체하는 오디오 편집 기능이 포함되어 있지 않습니다. 

향후 업데이트에서 음성 편집 기능 추가를 예고한 상태이지만 현재는 지원하고 있지 않아 나레이션 교체나 BGM 변경이 필요한 경우 별도 편집 도구를 병행해야 합니다. 

 

4. 크레딧·사용 한도를 미리 파악해야 합니다

Google AI Pro 플랜 기준 월 1,000 AI 크레딧이 제공되며, 영상 생성은 텍스트 생성보다 크레딧 소모가 훨씬 큽니다. 

마감이 가까운 프로젝트에서 크레딧을 소진할 경우 다음 갱신일까지 영상 생성이 제한될 수 있으므로, 프로젝트 시작 전 크레딧 잔량과 한도를 확인하는 것을 권장합니다.

 

AI 영상 플랫폼, 어디를 사용해야할지 고민중이라면

구글 비즈(Google Vids) 사용법, AI 아바타를 활용한 강의 영상 만들기

힉스필드 AI(Higgsfield AI) 사용법, 이미지로 시네마틱 영상 만드는 방법

그록 AI 사용법, 이렇게까지 되는지 몰랐습니다. 이미지·영상 생성부터 마케팅 전략까지 한 번에

FAQ

freelancerBanner
projectBanner
댓글0
이랜서에 로그인하고 댓글을 남겨보세요!
0
/200
이랜서에 로그인하고 댓글을 남겨보세요!
0
/200
실시간 인기 게시물
이랜서 PICK 추천 게시물