GLM 5.2 출시, 100만 토큰 컨텍스트로 무엇이 달라졌을까? 사용법과 한계 정리

개발 테크
4시간 전
조회수
72

GLM Coding Plan의 새로운 버전 5.2가 출시되었습니다.

* 이미지 출처: GLM 홈페이지

GLM 5.2가 출시되었습니다. 100만 토큰 컨텍스트 윈도우를 앞세워, 코드베이스 전체를 오래 다루는 장시간 에이전트형 소프트웨어 엔지니어링에서의 성능과 개방성을 함께 내세운 모델입니다. 

미국 정부가 Anthropic의 Claude Fable 5에 대한 해외 접근을 제한한 다음 날 바로 공개되며, 모델을 닫는 쪽과 여는 쪽이 묘하게 대비를 이뤘습니다. 

이 글에서는 GLM 5.2가 어떤 모델인지, GLM-5.1과 무엇이 달라졌는지, Claude Code 등 기존 도구에 연결하는 방법, 그리고 도입 전에 확인해야 할 주의사항까지 정리해보겠습니다.

 

GLM 5.2 핵심 요약

  • 100만 토큰 컨텍스트 오픈소스 LLM 중에서도 큰 축에 드는 1M 토큰 컨텍스트 윈도우를 지원해, 대형 코드베이스를 한 번에 올려 작업하는 시나리오를 겨냥합니다.
  • 코딩 · 에이전트 특화 Zhipu AI는 GLM 5.2를 장시간(long-horizon) 코딩 작업에 강점을 둔 모델로 설명합니다. 챗봇 순위보다 자율 에이전트형 소프트웨어 엔지니어링에 초점을 맞췄습니다.
  • 기존 코딩 도구 즉시 호환 Claude Code, Cline, OpenCode, Roo Code 등 8종 도구와 출시 첫날부터 호환됩니다. Anthropic 호환 엔드포인트라 주소와 키만 바꾸면 됩니다.
  • 두 가지 추론 모드 High와 Max 두 단계의 사고 강도를 제공하며, 복잡한 코딩에는 Max가 권장됩니다.

 

GLM 5.2란?

GLM 5.2의 특징에 대해 정리했습니다.

GLM 5.2는 중국 AI 기업 Zhipu AI(즈푸 AI)가 공개한 GLM(General Language Model) 시리즈의 최신 코딩·에이전트 모델입니다. Zhipu AI는 GLM-5.1을 내놓은 지 몇 달 만에 후속 버전을 출시하며 빠른 반복 개발 속도를 보이고 있습니다.

'실제로 쓸 수 있는(usable)' 수준의 100만 컨텍스트 윈도우를 바탕으로 코드베이스 전체를 다루는 장시간 에이전트 작업을 목표로 추론 모델이 더욱 탄탄해 졌는데요. GLM 5.1과 어떻게 달라졌는지 함께 살펴보겠습니다.

 

GLM-5.1 vs GLM 5.2, 무엇이 달라졌을까?

컨텍스트 윈도우가 100만 토큰으로 확장됐습니다

GLM-5.1에서 약 200K에 머물던 컨텍스트 윈도우가 GLM 5.2에서는 100만 토큰으로 약 5배 늘었습니다. 

기존 200K에서는 대형 저장소를 한 번에 올리기 어려워 코드를 잘라 넣거나 작업 도중 앞부분 맥락이 잘려나가는 일이 있었는데, 이제는 프로젝트의 상당 부분을 한 번에 올려둔 채 작업할 수 있습니다. 

그 덕분에 여러 파일에 걸친 리팩토링이나 장시간 이어지는 에이전트 작업에서 파일을 쪼개 결과를 다시 이어 붙이는 수고가 줄고, 전체 맥락을 유지하므로 잘라 붙이는 과정에서 생기던 누락이나 오류 위험까지 함께 낮아집니다.

 

추론 강도를 단계로 고르는 effort 레벨을 도입했습니다

GLM-5.1도 추론(thinking) 기능을 갖춘 모델이었지만, 작업에 따라 추론의 깊이를 조절하는 방식은 제한적이었습니다. GLM 5.2는 여기에 High와 Max 두 단계의 추론 강도(thinking-effort) 레벨을 더해, 작업 성격에 맞춰 사고 강도를 직접 고를 수 있게 했습니다. 

그래서 복잡한 다단계 코딩에는 Max로 더 깊은 추론을 적용해 완성도를 높이고, 가벼운 작업에는 High로 처리해 불필요한 추론 소모를 줄일 수 있습니다. 

 

GLM 5.2 사용법

GLM 5.2는 출시 시점 기준 GLM Coding Plan으로만 제공되어, Coding Plan API Key를 발급해 Claude Code나 Codex 같은 코딩 에이전트 파일에 연동해 사용가능합니다. 독립 API와 가중치는 추후 공개가 예고되어 있습니다.

이미 GLM 5.1을 Coding Plan으로 쓰고 있었다면, 기존 키를 그대로 사용하고 모델명만 바꾸면 됩니다. API Key 발급 방법이 필요하다면, 아래 링크에서 발급 방법을 참고하세요.

  GLM의 API Key 발급방법 확인하기

 

Claude Code에 GLM 5.2 연결하기

Claude Code에서 GLM 5.2를 쓰려면 provider 설정, 즉 Claude Code가 Anthropic 서버 대신 Z.ai 서버를 바라보게 base URL과 API Key를 바꿔주는 작업이 필요합니다. 이를 위해 settings.json 파일을 직접 수정해야합니다.

WIndow

notepad $HOME.claude\settings.json

Mac

open ~/.codex/config.toml

Linux

nano ~/.codex/config.toml

 

claude\settings.json을 열면 세부 내용이 나옵니다.

운영체제에 맞춰 위의 명령어를 입력해 Setting. Json 파일을 엽니다. 파일이 열리면 아래 내용을 입력하고 저장합니다. 발급받은_Z.ai_API_키 자리에는 앞서 Coding Plan 콘솔에서 발급한 키를 넣습니다.

 

settings.json 파일 내 GLM 5.2[1M] 설정 방법

JSON
{
"env": {
"ANTHROPIC_AUTH_TOKEN": "발급받은_Z.ai_API_키",
"ANTHROPIC_BASE_URL": "https://api.z.ai/api/anthropic",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-5.2[1m]",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-5.2[1m]",
"CLAUDE_CODE_AUTO_COMPACT_WINDOW": 1000000
}
}

저장한 뒤 터미널을 닫고 새로 열어 claude code를 실행하면 GLM 5.2가 적용됩니다. 

 

claude code에 glm 5.2가 적용되어 /model에서 glm 5.2가 추가된 것을 확인할 수 있습니다.

/model을 입력해 사용 모델을 확인해보면, Opus와 Sonnet 모델에 GLM 5.2[1M] 모델이 세팅된 것을 볼 수 있습니다.

 

Codex에 GLM 5.2 연결하기

Codex는 OpenAI 호환 도구라 OpenAI 프로토콜 엔드포인트(https://api.z.ai/api/coding/paas/v4)로 연결하고 설정 파일도 ~/.codex/config.toml을 사용합니다. API Key는 앞서 발급한 Coding Plan 키를 그대로 씁니다. 

Window

notepad $HOME.codex\config.toml

Mac

notepad $HOME.codex\config.toml

Linux

notepad $HOME.codex\config.toml

운영체제에 맞는 명령어를 터미널에 입력해 설정 파일을 엽니다.

 

codex에 glm 5.2를 연동하기 위해서는 config.toml을 설정해야 합니다.

config.toml 파일에 아래 내용을 입력하고 저장합니다. provider 블록에서 base URL을 Z.ai의 OpenAI 호환 엔드포인트로 지정하고, 모델을 GLM 5.2로 설정하는 부분입니다.

 

.codex/config.toml을 설정하는 방법

toml

model = "glm-5.2[1m]"

model_provider = "zai"

 

[model_providers.zai]

name = "Z.ai GLM Coding Plan"

base_url = "https://api.z.ai/api/coding/paas/v4"

$env_key = "ZAI_API_KEY"

wire_api = "responses"

Codex에서 GLM 5.2[1M]를 사용하기 위해서는 model과 model_provider를 같이 변경해주어야합니다.

상위 두 줄을 먼저 교체한 뒤 [model_providers_zai]를 나머지 공간에 입력해 주면 기존의 플러그인과 스킬을 모두 살리고 모델만 변경할 수 있습니다.

 

* API 키 환경 변수 등록 

Window

$env:ZAI_API_KEY="발급받은_Z.ai_API_키"

Mac · Linux

export ZAI_API_KEY="발급받은_Z.ai_API_키"

그다음 발급받은 API Key를 환경 변수로 등록할 때, Window와 Mac · Linux의 입력값이 다릅니다. 위의 내용을 따라 발급받은_Z.ai_API_키 자리에 앞서 복사한 키를 넣습니다.

 

설정을 수정한 대로 codex에 glm 5.2 버전이 추가되었습니다.

설정을 저장하면 Codex CLI를 실행했을 때 모델이 glm-5.2로 설정된 것을 볼 수 있습니다.

 

GLM 5.2, 실무에서는 이렇게 활용하세요

대형 코드베이스의 멀티파일 리팩토링

기존에는 컨텍스트 한계 때문에 수십 개 파일에 걸친 리팩토링을 AI에 맡기기 어려웠습니다. 일부만 올리면 전체 맥락을 놓치고, 작업이 길어지면 앞선 결정을 잊는 문제가 있었습니다. 

GLM 5.2는 100만 토큰 컨텍스트로 프로젝트 상당 부분을 한 번에 올려 작업할 수 있습니다. 그래서 레거시 코드를 대규모로 정리하거나 구조를 바꾸는 작업이 잦은 백엔드 개발자나 리드 개발자에게 유용합니다. 다만 생성된 변경은 반드시 사람이 검토하고 테스트로 검증해야 합니다.

 

기존 도구를 유지한 채 모델 비용 절감

기존에는 특정 폐쇄형 모델에 워크플로가 묶여 있으면 비용이나 접근 제한에 대응하기 어려웠습니다. GLM 5.2는 Claude Code를 비롯한 8종 도구와 호환되고, GLM Coding Plan은 프런티어급 모델치고 저렴한 편입니다

그래서 이미 코딩 에이전트를 쓰고 있으면서 모델 비용이나 접근성 때문에 대안을 찾던 개발팀에게 유용합니다. 도입 전 자사 작업 기준의 품질 비교는 필수입니다.

 

GLM 5.2 사용 시 주의사항

공식 벤치마크가 아직 없습니다. 

GLM 5.2는 출시 시점에 표준 벤치마크 점수와 제3자 검증이 모두 부재합니다. 성능 우위 주장은 독립 검증 전까지 마케팅으로 보고, 도입 판단은 자사 코드 기준의 자체 평가로 내려야 합니다.

가중치는 아직 공개 전입니다. 

MIT 가중치는 예고 단계로, 출시 시점에 모델을 쓰는 경로는 GLM Coding Plan뿐입니다. 자체 호스팅 계획이 있다면 실제 가중치 공개 시점과 라이선스 원문을 확인한 뒤 진행해야 합니다.

자체 호스팅에는 대규모 GPU가 필요합니다. 

한 매체 기준 FP8 체크포인트가 약 860GB VRAM을 요구하는 것으로 알려져, 다중 GPU 인프라가 전제됩니다. 노트북이나 단일 카드로 운영할 수 있는 모델이 아닙니다.

생성 코드는 직접 검증해야 합니다. 

에이전트가 멀티파일 수정까지 수행하므로, 저장소 권한과 실행 범위를 제한하고 변경 사항을 사람이 확인하는 절차를 운영에 포함하는 것이 안전합니다.

 

최신 AI 출시 소식이 궁금하다면 

Kimi K2.7 Code 출시, K2.6과 무엇이 달라졌을까? 가격·벤치마크·사용법 총정리

Claude Opus 4.8 출시, 달라진 점부터 실제 성능 테스트까지 총정리

Hermes Desktop 사용법, 설치부터 Agent 데이터 백업·복원까지

FAQ

freelancerBanner
projectBanner
댓글0
이랜서에 로그인하고 댓글을 남겨보세요!
0
/200
이랜서에 로그인하고 댓글을 남겨보세요!
0
/200
실시간 인기 게시물
이랜서 PICK 추천 게시물