Claude Code /ultrareview 사용법, 실행만 하면 끝까지 검수한다

개발 테크

4시간 전

조회수

AI가 코드 버그를 더 깊게 파헤쳐 검수하는 기능이 등장했습니다. 사용자가 요청만 내리면 AI가 스스로 여러 리뷰어 에이전트를 활용해 변경된 코드를 분석하고, 실제 문제가 될 수 있는 버그를 찾아냅니다. 바로 Claude Code의 ‘/ultrareview’입니다.

/ultrareview는 변경된 코드를 클라우드 샌드박스에서 분석하고, 여러 리뷰어 에이전트가 병렬로 버그를 찾은 뒤 확인된 문제를 정리해주는 코드 리뷰 명령어로, 리팩토링이나 기능 수정 과정에서 사람이 놓치기 쉬운 회귀 버그를 줄이기 위해 출시된 기능입니다.

이 글에서는 /ultrareview가 어떤 기능인지, 기존 /review와 무엇이 다른지, 실행 방법과 적합한 사용 상황, 그리고 사용시 주의사항까지 함께 정리했습니다.

Claude Code Ultrareview 핵심 요약

클라우드 멀티 에이전트 리뷰 변경 코드를 원격 샌드박스로 보내 여러 리뷰어 에이전트가 병렬로 분석합니다. 로컬 자원을 쓰지 않고 백그라운드에서 진행됩니다.
검증된 버그만 보고 한 에이전트가 찾은 후보를 다른 에이전트가 재현해 확인하는 검증 단계를 거칩니다. Anthropic 내부 테스트에서 오탐(잘못된 지적) 비율은 1% 미만이었습니다.
머지 전 리뷰 전용 전체 코드베이스 감사가 아니라, 현재 브랜치와 기본 브랜치 사이의 변경분(diff)만 검토합니다. 인증, 결제, 마이그레이션 같은 고위험 변경에 적합합니다.
추가 사용량으로 과금 리뷰 1회당 약 $5~$20가 플랜과 별도인 추가 사용량(extra usage)으로 청구됩니다. 출시 초기 무료 횟수는 2026년 5월 5일 만료됐습니다.
연구 프리뷰로 시작 2026년 4월 16일 Claude Code v2.1.111에 처음 도입됐고, 이후 도구 체인의 표준 기능으로 자리 잡았습니다.

Claude Code Ultrareview란?

Claude Code Ultrareview에 대해 정리했습니다.

/ultrareview는 변경된 코드를 클라우드 샌드박스로 보내 여러 에이전트가 병렬로 버그를 찾고 검증하는 코드 리뷰 명령어입니다.

AI가 코드를 작성하는 속도가 빨라지고 그 양이 많아지자, 사용자가 코드를 일일이 직접 검수하는 데는 한계가 생겼습니다. 그래서 AI에 코드 리뷰를 맡겨보지만, 대부분 한 번 훑고 마는 단일 패스라 사소한 스타일 지적과 진짜 버그가 뒤섞여 나옵니다. 정작 중요한 버그가 잡음에 묻히는 것입니다.

/ultrareview는 이 문제를 해결하기 위해 도입되었습니다.

교차 검증으로 버그를 찾아내는

/ultrareview의 4단계 파이프라인

Ultrareview는 단일 패스 리뷰가 놓치기 쉬운 버그를 더 철저히 찾아내기 위해, 여러 에이전트를 띄워 코드를 검토합니다. 이 에이전트들은 클라우드 샌드박스에서 동일한 4단계를 거쳐 작동합니다. 각 단계가 무엇을 하는지 알아두면 결과를 해석하기 쉽습니다.

1) Setup(준비)

Anthropic이 원격 인프라를 마련하고 서브 에이전트 묶음을 띄웁니다. 기본은 5개 에이전트이며 약 90초가 걸립니다.

2) Find(탐색)

에이전트들이 변경된 코드의 서로 다른 실행 경로를 병렬로 탐색합니다. 경쟁 상태(race condition), 로직 오류, 모듈 간 타입 불일치를 여러 각도에서 동시에 압박합니다.

3) Verify(검증)

별도의 에이전트들이 각 후보 발견을 재현해봅니다. 한 에이전트만 지적한 버그는 다른 에이전트의 도전을 받고, 독립적으로 확인되지 않으면 보고되지 않습니다.

4) Dedup(중복 제거)

여러 에이전트가 중복으로 찾은 내용을 하나의 순위화된 보고서로 합칩니다. 이렇게 네 단계를 거치면, 여러 에이전트가 찾아낸 버그 중 교차 검증을 통과한 진짜 버그만 추려집니다. 코드를 합치기 전에 문제를 잡아낼 수 있는 것입니다.

/ultrareview vs /review, 무엇이 다를까?

1. /review는 로컬에서 빠르게, /ultrareview는 클라우드에서 깊게

/review는 터미널 세션에서 단일 패스로 diff를 읽고 몇 초 만에 결과를 냅니다. 빠른 대신 가볍게 훑는 방식이라, 코드를 다듬는 중간중간 자주 돌리기에 적합합니다.

/ultrareview는 저장소 상태를 클라우드 샌드박스로 보내 5~20개 에이전트를 띄웁니다. 시간은 더 걸리지만, 노트북 한 대로는 불가능한 깊이의 병렬 리뷰가 가능합니다.

2. /review는 즉각 피드백, /ultrareview는 검증된 결과

/review는 변경분을 한 번 읽고 바로 의견을 주기 때문에, 빠르게 방향을 잡는 데 좋습니다. /ultrareview는 모든 발견을 별도 에이전트가 재현해본 뒤에만 보고합니다. 그래서 결과가 나오기까지 더 걸리는 대신, 재현되는 진짜 버그만 추려진 신뢰도 높은 결과를 받습니다.

3. /review는 빠른 점검, /ultrareview는 정밀 검증

/review와 /ultrareview는 어느 하나가 다른 하나를 대체하는 관계가 아닙니다.

/review는 코드를 다듬는 동안 자주 돌려 즉각 피드백을 받는 빠른 점검용이고, /ultrareview는 인증·결제·인프라처럼 버그 비용이 큰 변경을 합치기 직전에 깊이 검증하는 정밀 검토용입니다.

작업 단계에 따라 /review로 빠르게 확인하다가, 중요한 변경을 머지하기 전에 /ultrareview로 한 번 더 검증하는 식으로, 둘이 역할을 나눠 서로의 빈자리를 채웁니다.

Claude Code Ultrareview 사용법

Claude Code Ultrareview의 사용법에 대해 정리했습니다.

* 사전 준비

Claude Code v2.1.111 이상이 필요합니다. claude --version으로 확인할 수 있습니다.
PR 모드를 쓰려면 저장소에 github.com 원격이 연결되어 있어야 합니다.
무료 횟수가 만료됐으므로 계정에 추가 사용량(extra usage)이 활성화되어 있어야 합니다. /extra-usage로 확인하고, 꺼져 있으면 실행 단계에서 차단됩니다.

/ultrareview의 사용법을 정리하기 위해 테스트 상황을 만들고 직접 테스트를 실행했습니다. 테스트 상황은 아래와 같습니다.

* Claude Code Ultrareview 테스트 상황

UltraReview의 성능을 테스트하기 위해 별도의 테스트용 프로젝트를 만들었습니다. 프로젝트 폴더 안에는 사용자 권한과 사용자 정보를 처리하는 간단한 userService.js 파일이 있습니다.

먼저 정상적으로 작동하는 코드를 작성한 뒤 Git에 커밋했습니다. 이후 같은 코드를 더 짧게 정리하는 리팩토링 작업을 진행했지만, 이 과정에서 일부러 몇 가지 회귀 버그를 포함했습니다.

그래서 npm test를 실행하면 기존에는 통과하던 테스트가 실패하는 구조입니다.

이번 테스트에서는 UltraReview를 사용해 리팩토링 과정에서 기존 기능이 깨진 부분, 권한 판단 오류, null 처리 누락, 데이터 계산 오류 등을 제대로 찾아내는지 확인해보겠습니다.

/ultrareview를 테스트에 사용한 프롬프트는 아래와 같습니다.

/ultrareview 테스트용 프롬프트

이번 변경사항은 기존 `userService.js` 코드를 단순화하는 리팩토링 작업입니다.

새 기능을 추가한 것이 아니라, 기존 동작을 유지하면서 코드만 더 짧게 정리한 변경입니다.

리뷰할 때는 단순 코드 스타일보다 리팩토링 과정에서 기존 기능이 깨졌는지 확인하는 데 집중해 주세요.

다음 항목을 중심으로 확인해 주세요.

1. 기존 동작과 달라진 부분

2. 기존 테스트가 실패할 가능성이 있는 부분

3. `null` 또는 `undefined` 처리 누락

4. 사용자 권한 판단 로직 오류

5. 이메일 처리 방식 변경으로 인한 문제

6. 사용자 수 계산 로직 오류

7. 배포 전에 반드시 수정해야 할 회귀 버그

각 문제는 아래 형식으로 정리해 주세요.

- 발견한 문제

- 기존 코드에서는 어떻게 동작했는지

- 변경 후 어떤 문제가 생겼는지

- 실제로 어떤 상황에서 문제가 발생하는지

- 수정 우선순위

- 수정 제안 코드

- 추가로 필요한 테스트

UltraReview는 먼저 리뷰 기준을 프롬프트로 입력한 뒤, 다음 입력에서 /ultrareview master 명령어만 따로 실행하는 방식이 좋습니다.

명령어와 프롬프트를 한 줄에 함께 입력하면, 뒤 문장이 브랜치 이름이나 비교 대상으로 인식돼 오류가 날 수 있습니다. 따라서 프롬프트로 리뷰 방향을 먼저 전달하고, 이후 /ultrareview 명령어로 리뷰를 실행합니다.

/ultrareview를 실행하면 일반 명령어처럼 바로 결과를 출력하는 것이 아니라, 별도의 클라우드 세션에서 리뷰가 진행됩니다.

여러 리뷰 에이전트가 변경된 코드를 분석하는 방식이기 때문에, 실행 후에는 잠시 대기해야 합니다. 리뷰가 완료되면 Claude Code 화면에 발견된 문제와 수정 방향이 정리되어 표시됩니다.

/ultrareview 테스트 결과

Ultrareview 작업 결과 요청한 프롬프트의 목적과 맞게 refactor-user-service 브랜치와 master 브랜치를 비교해서 src/userService.js에서 총 5개의 문제를 찾았습니다. 일부러 넣은 회귀 버그를 대부분 정확히 찾아냈고, 수정 코드 방향까지 제안했습니다.

/ultrareview, 이런 상황에 쓰면 좋습니다

고위험 변경의 머지 전 점검

/ultrareview는 500줄을 넘는 변경이나 보안 민감 코드를 머지 전에 멀티 에이전트로 검증합니다. 그래서 인증 시스템 리팩토링이나 스키마 마이그레이션을 자주 다루는 백엔드 개발자나 리드 개발자가, 롤백 비용이 큰 변경을 안전하게 내보내야 할 때 유용합니다.

모듈 경계를 넘나드는 복잡한 리팩토링

/ultrareview는 여러 에이전트가 변경을 동시에 다른 각도로 탐색합니다. 그래서 경쟁 상태나 모듈 간 타입 불일치처럼 한 에이전트가 전체 그림을 동시에 들고 있어야 잡히는 문제를 다루는 개발자에게 유용합니다.

외부 기여자나 오픈소스 PR 검토

/ultrareview는 PR 번호만 넘기면 샌드박스가 GitHub에서 직접 복제해 검토합니다. 그래서 기여자 PR이나 본인이 관리하는 오픈소스 저장소의 변경을 머지 전 점검해야 하는 메인테이너에게 유용합니다.

/Ultrareview 사용 시 주의사항

1. 무료 사용 한도를 확인해야 합니다

UltraReview는 무료로 무제한 사용할 수 있는 기능이 아닙니다. 무료 실행 횟수를 모두 사용하면 이후 리뷰는 사용량 크레딧 기준으로 과금됩니다. 따라서 작은 수정마다 반복해서 실행하기보다는, 배포 전 검토나 중요한 리팩토링처럼 꼭 필요한 시점에 사용하는 것이 좋습니다.