제미나이 3.5 Flash 공개, 이제 AI는 답변을 넘어 실행으로 간다

밸런스 UP
4시간 전
조회수
18

포럼에서 새로운 모델 출시에 대한 내용을 발표하고 있습니다.

Gemini 3.1 Pro가 출시된 지 불과 3개월 만에 새로운 버전이 공개됐습니다. 바로 ‘Gemini 3.5 Flash’입니다.

이번 공개에서 눈길을 끄는 건 Flash 버전만 먼저 나왔다는 점입니다. 통상 저가 · 고속 모델로 분류되는 Flash 등급임에도, 벤치마크 결과에서 이전 세대 Pro 모델을 앞서는 수치를 기록하며 출시 직후부터 화제가 됐습니다.

검색 시장을 기반으로 AI 전 분야로 영역을 확장하고 있는 Google이 이번엔 어떤 카드를 꺼내 들었는지, Gemini 3.5 Flash의 성능과 변화를 짚어봤습니다.

 

제미나이 3.5 Flash 핵심요약

  • 제미나이 3.5 Flash는 에이전트형 AI 전환을 강조한 모델입니다. 질문에 답하는 수준을 넘어, 목표를 받으면 도구를 연결하고 여러 단계를 처리하는 방향으로 발전했습니다.
  • Flash 모델이지만 코딩·에이전트 성능이 크게 강화됐습니다. Terminal-Bench 2.1, MCP Atlas 등에서 높은 점수를 보였고, 이전 Pro 모델을 앞서는 영역도 확인됐습니다.
  • 실제 테스트에서는 속도와 멀티스텝 작업 능력이 두드러졌습니다. SVG 테스트에서는 3.1 Pro보다 완성도는 낮았지만 생성 속도가 빨랐고, 회의록 정리와 Gmail 답변 생성까지 이어졌습니다.
  • 제미나이 3.5 Flash의 활용 가치는 백그라운드 업무 처리에서 더 뚜렷하게 드러납니다. 사용자가 계속 화면을 보고 있지 않아도 회의 준비, 메일 초안 작성, 후속 작업 정리처럼 반복 업무를 대신 준비하는 방향으로 확장되고 있습니다. 

 

제미나이 3.5 Flash

(Gemini 3.5 Flash)란? 

새로 출시된 제미나이 3.5 Flash에 대해서 정리했습니다.

제미나이 3.5(Gemini 3.5)는 Google DeepMind가 2026년 5월 19일 Google I/O 2026에서 공개한 최신 AI 모델입니다. 

Google은 이번 모델의 개발 방향을 ‘Frontier Intelligence with Action’(행동이 뒷받침되는 프론티어)’으로 정의하며, AI 모델에서 AI 에이전트형 모델로의 전환을 공식화했습니다. 

 

사용하는 도구에서 일하는 AI 에이전트로

제미나이 3.5 Flash는 질문에 답하는 대화형 AI에서 벗어나, 목표를 받으면 스스로 계획을 세우고 필요한 도구를 호출하며 실제 업무를 끝까지 처리하는 방식으로 설계됐습니다.

Gmail, Calendar, Drive 같은 외부 서비스와 연동해 멀티스텝 작업을 자동으로 처리하고, Antigravity 하네스를 통해 역할별 서브에이전트를 병렬로 실행해 복잡한 업무를 동시에 진행하는 구조로 발전했습니다. 

결국 사용자가 지시하면 AI가 알아서 연결하고 실행해 완료까지 이어가는, 실제로 일하는 AI를 만드는 방향을 추구하고 있습니다. 

 

제미나이 3.5 Flesh, 커뮤니티 반응은?

새로 출시된 제미나이 3.5 Flash의 커뮤니티 반응을 정리했습니다.

 

Flash가 더 이상 저렴한 모델이 아니다

이번 제미나이 3.5 Flash 공개로 커뮤니티 반응에서 가장 큰 비중을 차지하는 건 가격 인상에 대한 부정적 반응입니다. 

Gemini 3 Flash Preview 사용자 기준으로는 3배, Gemini 3.1 Flash-Lite 사용자 기준으로는 6배 인상으로, API 비용 인상에 대해 비판적인 뉘앙스의 글이 올라오기도 했습니다.

 

속도는 인정, 가성비는 의문

반면 속도 개선 자체는 긍정적으로 평가하는 의견이 많습니다. 코딩이나 에이전트 작업에서 나아진 부분은 인정하면서도 이전 Pro 모델이 더 안정적이라는 비교 평가도 자주 등장합니다.

하지만 tool call이 과도하게 발생하면 실질 비용이 더 늘어날 수 있다는 점도 지적되고 있으며,  가격 인상 폭에 비해 체감되는 성능 개선이 크지 않다는 반응이 우세합니다. 

 

* Gemini 주요 모델 API 가격 비교 (100만 토큰 기준)

구분 / API 항목

Gemini 3.5 Flash(최신 모델)

Gemini 3.1 Pro(고성능 모델)

Gemini 3.1 Flash(범용 모델)

Gemini 3.1 Flash-Lite(경량 가성비 모델)

표준 입력 요금

(Input / 1M)

$1.50

$2.00

(≤200K 기준)

$0.45

$0.125

표준 출력 요금

(Output / 1M)

$9.00

(Thinking 포함)

$12.00

(≤200K, Thinking 포함)

$2.70

$0.75

긴 컨텍스트 할증

없음(단일 요금제)

2배 할증 (>200K 시)

입력: $4.00 / 출력: $18.00

없음

(단일 요금제)

없음

(단일 요금제)

비동기 배치 요금

(Batch API)

50% 할인

입력: $0.75 / 출력: $4.50

50% 할인

입력: $1.00 / 출력: $6.00

50% 할인

입력: $0.225 / 출력: $1.35

50% 할인

입력: $0.0625 / 출력: $0.375

컨텍스트 캐시 읽기

(Context Caching)

$0.15

$0.20

(≤200K 기준)

$0.045

$0.0125

 

Gemini 3.5 Flash 누구에게 유리한가

기존 Gemini 3 Flash Preview 사용자에게는 3배 가격 인상이지만, Gemini 3.1 Pro 사용자 기준으로는 오히려 약 25% 저렴해집니다. 

반면 Flash 사용자에게는 부담이 크고, Pro에서 넘어오는 사용자에게는 오히려 긍정적인 조건입니다. 

결국 Google이 Flash 라인을 저가 모델에서 중상위 가격대로 이동시킨 결과라는 해석이 많습니다. 향후 3.5 Pro의 성능과 가격 정책에 따라 실질적인 반응이 달라질 것으로 보입니다. 

 

제미나이 3.5 Flash, 무엇이 달라졌을까?

제미나이 3.5 Flash가 이전 버전과 어떤 점이 달라졌는지 정리했습니다.

 

모델 성능 변화

이번 버전의 가장 큰 변화는 Flash 등급 모델의 성능이 크게 올라갔다는 점입니다. 기존에는 Pro 모델이 고성능 작업을 담당하고 Flash 모델은 속도와 비용 효율에 강한 모델로 인식됐지만, Gemini 3.5 Flash는 코딩 · 에이전트 작업에서 이전 Pro 모델을 앞서는 성능을 보여줍니다.

평가 영역 (Benchmark)

제미나이 3.5 Flesh 점수

주요 특징 및 의미

Terminal-Bench 2.1 (코딩/터미널 환경)

76.2%

이전 세대 최고 사양인 제미나이 3.1 프로를 능가하는 코딩 능력

MCP Atlas (복잡한 툴 연동/확장 수행)

83.6%

모델 컨텍스트 프로토콜(MCP) 기반의 다단계 워크플로우 1위

CharXiv Reasoning (멀티모달 추론)

84.2%

차트, 이미지, 스크린샷 등 시각 자료에 대한 최고 수준의 이해도

MMMU-Pro (대학 수준 멀티모달 이해)

83.6%

복잡한 학술적·시각적 데이터 분석 및 추론 능력 우수

출력 속도 (Tokens per Second)

약 4배~11.6배 향상

타 프론티어 모델 대비 4배, 3.1 프로 대비 2.4배 빠른 속도 (초당 약 280~290 토큰 처리)

 

에이전트 변화

에이전트 변화의 핵심은 Gemini Spark와 Antigravity 하네스를 중심으로 한 백그라운드 작업 · 서브에이전트 구조입니다.

Gemini Spark는 Gemini 3.5 Flash를 기반으로 동작하는 개인 AI 에이전트입니다. 사용자가 계속 화면을 보고 있지 않아도 백그라운드에서 업무를 이어갈 수 있도록 설계됐으며, Gmail, Docs, Sheets, Slides 등 Google Workspace 앱과 연결해 디지털 업무를 처리하는 방향으로 확장되고 있습니다.

Antigravity 하네스 기반의 서브에이전트 구조도 중요한 변화입니다. Antigravity 환경에서는 작업을 여러 역할로 나누고, 각 에이전트가 프론트엔드, 백엔드, 테스트, 문서화, 보안 검토 같은 업무를 병렬로 수행할 수 있습니다. 

덕분에 여러 서브에이전트를 병렬로 실행해 장기 데이터를 분석하고 예측 정확도를 높이는 방식도 가능해졌습니다.

 

UX/UI의 변화

UX/UI 변화는 Gemini 앱의 기본 모델 전환과 AI 중심 사용 경험 강화로 정리할 수 있습니다.

Gemini 3.5 Flash는 Gemini 앱과 Google Search AI Mode에 적용되며, 일반 사용자도 별도 개발 환경 없이 새로운 모델 기반의 검색 · 대화 경험을 사용할 수 있게 됐습니다. 사용자는 단순히 키워드를 입력해 검색 결과를 고르는 방식에서 벗어나, 질문을 던지고 AI가 정리한 답변과 시각 자료를 함께 확인하는 방식으로 이동하고 있습니다.

Gemini 앱의 화면 경험도 더 직관적인 방향으로 바뀌었습니다. Ask Gemini 중심의 입력 경험이 강조되고, Gemini Live와 같은 기능이 더 자연스럽게 통합되면서 사용자는 텍스트, 음성, 이미지 등 다양한 방식으로 AI와 상호작용할 수 있습니다.

 

코딩 · 개발 환경 변화

Gemini 3.5 Flash의 코딩 성능도 개선됐습니다. 특히 반복적인 코딩 사이클, 빠른 프로토타입 탐색, UI 코드 생성, 에이전트 기반 개발 작업에 적합한 구조로 설계됐습니다.

Google AI Studio, Android Studio, Firebase, Gemini Enterprise Agent Platform 등과의 통합도 강화되면서 개발자가 Gemini 3.5를 실제 개발 환경 안에서 활용할 수 있는 범위가 넓어졌습니다.

 

제미나이 3.5 Flash, 실제 성능은 어떨까?

제미나이 3.5 Flash의 실제 성능을 테스트했습니다.

 

1. SVG 또는 코드 기반 그래픽 테스트

SVG를 제대로 만들려면 단순한 코딩 실력이 아니라, 공간 추론(spatial reasoning)기하학적 정확도물리적 구조 이해(자전거 프레임이나 현실적인 페달링 자세 등), 그리고 미적 감각까지 종합적으로 요구됩니다.

게다가 코드를 깔끔하게 작성한 뒤 브라우저에서 바로 렌더링해서 결과를 눈으로 확인해야 하죠.

그래서 이번 Gemini 3.5 Flash에서 크게 향상된 공간 추론 능력과 복잡한 코딩 + 시각적 이해 통합 능력이 실제로 얼마나 진짜 실력으로 연결되는지, 가장 직관적이고 효과적으로 확인할 수 있는 테스트입니다.

 

SVG 또는 코드 기반 그래픽 테스트에 사용한 프롬프트

아름답고 밝은 SVG 일러스트를 생성해 주세요.

주제: 맑은 낮의 바다 등대와 방파제 풍경 (Lighthouse and Breakwater on a Sunny Day)

구성:

- 전경(Foreground): 파도 치는 바닷가, 방파제의 콘크리트 구조물과 철제 난간, 작은 야생화와 풀

- 중경(Midground): 긴 방파제와 그 끝에 서 있는 빨간색과 흰색 줄무늬의 고전적인 등대

- 배경(Background): 밝고 맑은 푸른 하늘, 부드러운 구름, 먼 바다와 수평선

요구사항:

- 강한 입체감과 자연스러운 원근법을 극대화 (전경·중경·배경의 깊이감이 명확하게 느껴지게)

- 밝고 청량한 낮 분위기 (강한 햇빛, 선명한 색감, 부드러운 그림자)

- 등대의 구조와 방파제의 질감, 파도의 움직임, 빛 반사를 세밀하게 표현

- 전체적으로 밝고 상쾌하며 희망적인 느낌

완전하고 유효한 SVG 코드만 마크다운 코드 블록 안에 출력해 주세요. 

 

제미나이 3.1 Pro

제미나이 3.1 Pro로 SVG 테스트를 진행했습니다.

 

제미나이 3.5 Flesh

제미나이 3.5 Flash로 SVG 테스트를 진행했습니다.

SVG 그래픽 테스트는 3.1 Pro 결과와 나란히 비교할 수 있도록 준비했습니다. 두 모델 모두 프롬프트에 담긴 내용을 반영한 SVG 그래픽을 완성했지만, 동일한 프롬프트 기준으로 했을 때 완성도는 3.1 Pro가 더 높았습니다. 다만 생성 속도에서는 3.5 Flash가 확연히 빨랐습니다. 

 

2. 멀티스텝 에이전트 작업 테스트 

Gemini 3.5 Flash의 멀티스텝 에이전트 성능을 테스트하기 위해 AI 업무 에이전트 역할을 부여하고 4단계 업무 처리를 요청했습니다.

가상 회의록을 전달하면 Google Docs에 저장하고, 내용을 분석한 뒤, 지정된 담당자에게 Gmail로 답변을 작성하는 흐름입니다. AI가 스스로 계획을 세우고 각 단계를 얼마나 완성도 있게 처리하는지 확인하는 데 초점을 뒀습니다.

 

1) 구글 Docs에 회의록 정리

제미나이 3.5 Flash가 요청한대로 회의록을 Google Docs에 정리한 것을 볼 수 있습니다.

 

2) Gmail 답변 생성

제미나이 3.5 Flash로 회의록을 정리하고 Gmail로 보낼 답변을 생성하라고 요청했을 때, 요청대로 정리한 것을 볼 수 있습니다.

 

3) 가이드 및 주의사항 정리

제미나이 3.5 Flash로 업무 진행을 요청했을 때 가이드와 주의사항을 정리해준 것을 볼 수 있습니다.

프롬프트 요청대로 회의록을 Google Docs에 저장하고 내용을 분석한 뒤, 담당자에게 보낼 메일 초안까지 스스로 작성했습니다. 여기에 더해 향후 업무 처리 방향과 주의사항을 정리한 가이드라인도 함께 남겼습니다. 

단순히 요청한 단계를 수행하는 데 그치지 않고, 다음 행동까지 미리 준비한 결과물로 3.5 Flash의 멀티스텝 에이전트 성능을 직접 확인할 수 있었습니다. 

 

3. 긴 문서 분석 · 재구성 테스트 

제미나이 3.5 Flash의 성능을 테스트하기 위해 긴 문서를 분석하고 재구성하는 테스트를 실행했습니다.

제미나이 3.5 Flash는 3.1 Pro와 동일하게 입력 100만 토큰, 출력 64K 토큰을 지원합니다. 토큰 수 자체가 늘어난 건 아니지만, 이전 프론티어 모델 대비 출력 속도가 더 빠르게 개선되었습니다.

또한 에이전트형 작업과 장기 작업 수행에 초점을 맞춘 만큼, 사용자의 요청을 단순 요약에 그치지 않고 목표를 분석해 필요한 단계로 나눈 뒤 결과물 형태로 정리합니다. 

이를 확인하기 위해 구조가 복잡한 반도체 관련 논문을 첨부하고, 발표용 PPT 구성안으로 재구성하는 테스트를 진행했습니다.

 

긴 문서 분석 · 재구성 테스트에 사용한 프롬프트

첨부한 반도체 관련 논문을 분석해서 발표용 PPT 구성안으로 재구성해줘. 논문 내용을 그대로 요약하지 말고, 반도체를 처음 접하는 사람도 이해할 수 있도록 설명 흐름을 바꿔줘.

발표 주제는 ‘반도체의 구성 요소와 이를 만드는 주요 기업’이야.

PPT는 10장 내외로 구성하고, 각 슬라이드마다 다음 내용을 정리해줘.

 

1. 슬라이드 제목

2. 핵심 메시지

3. 들어가야 할 내용

4. 추천 시각 자료

5. 함께 언급하면 좋은 대표 기업

 

반드시 포함해야 할 내용은 다음과 같아.

 

- 반도체의 기본 구조

- 트랜지스터, 배선층, 메모리 셀, 패키지의 역할

- 메모리 반도체와 시스템 반도체의 차이

- 설계, 웨이퍼 제조, 장비, 후공정·패키징 단계

- 각 단계별 대표 기업

- AI 반도체와 HBM이 왜 중요해졌는지

 

어려운 기술 용어는 비전문가도 이해할 수 있는 표현으로 바꿔줘. 마지막에는 발표자가 강조해야 할 핵심 메시지 3가지를 정리해줘.

 

제미나이 3.5 Flash로 긴 문서 분석 · 재구성 테스트를 진행한 결과입니다.

요청한 프롬프트에 맞춰 첨부한 논문 4종을 구조적으로 분석한 뒤 PPT 슬라이드 별로 다룰 내용과 발표자가 강조해야 할 포인트까지 정리했습니다. 

단순한 내용 요약이 아니라 사용자의 의도에 맞게 정보를 재구성해 결과물을 출력한 것을 볼 수 있습니다.

 

AI 에이전트, 어디까지 발전할까 

이번 Gemini 3.5 Flash 공개는 AI의 방향이 스스로 일하는 에이전트형 모델로 전환됐음을 보여주는 발표였습니다. 

뛰어난 추론 능력을 바탕으로 단순 답변을 넘어 여러 단계의 업무 흐름을 스스로 처리하는 AI, 그리고 성능뿐 아니라 처리 속도까지 높아지면서 일상 업무에 더욱 깊숙이 들어올 가능성을 확인할 수 있었습니다. 

ChatGPT, Claude에 이어 제미나이까지 모두 AI 에이전트 성능을 강화하며 AI 에이전트 성능을 강화하며 앞으로 누가 AI 에이전트 시장을 선점할 것인지가 이 시장의 핵심 관전 포인트가 되고 있는데요. 

Gemini 3.5 Pro 출시가 남아 있는 만큼Google이 에이전트 AI 시대의 판을 어떻게 완성할지 지켜볼 시점입니다. 

 

최신 AI 모델은 어떤 성능을 선보이는지 궁금하다면

Claude Opus 4.7 출시, 이전 버전과 무엇이 달라졌을까?

왕의 귀환이라 불리는 ChatGPT 5.5, 얼마나 바뀌었을까?

Hermes Agent 사용법, 설치부터 활용 노하우까지

FAQ

freelancerBanner
projectBanner
댓글0
이랜서에 로그인하고 댓글을 남겨보세요!
0
/200
이랜서에 로그인하고 댓글을 남겨보세요!
0
/200
실시간 인기 게시물
이랜서 PICK 추천 게시물