Codex

AI Coding Tools 비교 2025.09.27
Claude Code vs Codex 2025.09.07 2

AI Coding Tools 비교

2025. 9. 27. 19:41

Claude를 이용해서 AI Coding 도구를 상세 비교해봤어요. 2025년 9월 말 기준 Claude에서도 Open AI Codex가 가장 좋다고 하네요.

AI 코딩 도구 상세 비교

기본 정보 비교

도구명	개발사	기반 모델	출시/업데이트	주요 특징
GPT-5-Codex	OpenAI	GPT-5	2024년 9월	동적 사고 시간 조절 (초~7시간)
Claude Code	Anthropic	Claude 4	2024년	터미널 전용 코딩 에이전트
GitHub Copilot	Microsoft/OpenAI	GPT-5-Codex (최신)	2021년 (지속 업데이트)	IDE 통합 코드 완성
Gemini CLI	Google	Gemini	2024년	Google 생태계 통합
Cursor	Anysphere	다양한 모델	2023년	AI 네이티브 에디터
Windsurf	Codeium	다양한 모델	2024년	통합 개발 환경

접근 방식 및 플랫폼

도구명	CLI 지원	IDE 통합	웹 인터페이스	모바일 앱	독립 에디터
GPT-5-Codex	✅ Codex CLI	✅ 확장프로그램	✅ ChatGPT/GitHub	✅ ChatGPT 앱	❌
Claude Code	✅ 전용 CLI	❌	❌	❌	❌
GitHub Copilot	✅ gh copilot	✅ VS Code, JetBrains	✅ GitHub	❌	❌
Gemini CLI	✅ 전용 CLI	제한적	✅ Gemini	❌	❌
Cursor	❌	❌	❌	❌	✅ 전용 에디터
Windsurf	❌	❌	❌	❌	✅ 전용 에디터

핵심 기능 비교

기능	GPT-5-Codex	Claude Code	GitHub Copilot	Gemini CLI	Cursor	Windsurf
코드 생성	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐
코드 완성	⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐
코드 리뷰	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐	⭐⭐⭐	⭐⭐⭐
버그 탐지	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐	⭐⭐⭐	⭐⭐⭐
리팩토링	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐
테스트 생성	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐	⭐⭐⭐	⭐⭐⭐
프로젝트 구축	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐	⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐
장시간 작업	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐	⭐⭐	⭐⭐⭐	⭐⭐⭐

성능 벤치마크

벤치마크	GPT-5-Codex	Claude Code	GitHub Copilot	기타
SWE-bench Verified	74.9%	~70%*	~65%*	-
HumanEval	고성능	고성능	우수	-
코드 품질	매우 높음	매우 높음	높음	보통-높음
응답 속도	동적 조절	빠름	매우 빠름	빠름

*추정치 (공식 벤치마크 미공개)

가격 정책

도구명	무료 티어	개인 요금	비즈니스 요금	API 요금
GPT-5-Codex	ChatGPT 무료 제한	ChatGPT Plus $20/월	ChatGPT Team $25/월	$1.25/1M 입력, $10/1M 출력
Claude Code	제한적	Claude Pro 구독	Claude Team 구독	Claude API 요금
GitHub Copilot	60일 무료 체험	$10/월	$19/월	-
Gemini CLI	Google AI 무료 할당량	Gemini Pro 구독	엔터프라이즈 문의	Gemini API 요금
Cursor	무료 티어 있음	$20/월	$40/월	-
Windsurf	무료 티어 있음	유료 플랜 있음	엔터프라이즈 플랜	-

지원 언어 및 프레임워크

도구명	주요 언어 지원	프레임워크 지원	특화 분야
GPT-5-Codex	Python, JavaScript, Go, OCaml 등	React, Django, Flask 등	풀스택, 시스템 프로그래밍
Claude Code	대부분 주요 언어	광범위한 프레임워크	범용 프로그래밍
GitHub Copilot	수십 개 언어	GitHub 생태계 프레임워크	Git 기반 워크플로우
Gemini CLI	주요 언어 지원	Google Cloud 서비스	클라우드 네이티브
Cursor	대부분 언어	다양한 프레임워크	실시간 협업
Windsurf	주요 언어	웹 개발 프레임워크	웹 개발

장단점 요약

GPT-5-Codex

장점: 최고 성능, 동적 작업 시간, 강력한 코드 리뷰 단점: 상대적으로 높은 비용, API 제한

Claude Code

장점: 터미널 특화, 자연어 처리 우수, 단계별 설명 단점: CLI만 지원, IDE 통합 없음

GitHub Copilot

장점: 광범위한 IDE 지원, Git 통합, 큰 커뮤니티 단점: 실시간 완성 위주, 복잡한 프로젝트 구축 제한

Gemini CLI

장점: Google 생태계 통합, 최신 AI 기술 단점: 상대적으로 새로움, 제한적인 문서

Cursor

장점: 올인원 에디터, 실시간 협업, 직관적 UI 단점: 새로운 에디터 학습 필요, 플랫폼 의존성

Windsurf

장점: 통합 개발 환경, 웹 개발 특화 단점: 상대적으로 새로움, 제한적인 언어 지원

선택 가이드

최고 성능 원할 때: GPT-5-Codex
터미널 작업 중심: Claude Code
기존 IDE 계속 사용: GitHub Copilot
Google 생태계 사용자: Gemini CLI
올인원 솔루션: Cursor
웹 개발 중심: Windsurf
예산 고려: Codeium (무료)

저작자표시 비영리 변경금지 (새창열림)

'Machine Learning' 카테고리의 다른 글

RAG 노코드 Dify로 맞춤형 챗봇 만들기 2/2 (0)	2025.12.11
RAG 노코드 Dify로 맞춤형 챗봇 만들기 1/2 (0)	2025.12.10
Scale의 법칙과 GPT-5: 멀티코어처럼 진화하는 AI (8)	2025.08.12
아내의 ChatGPT 사용을 보며 (10)	2025.08.06
머신러닝과 기존 기술 (1)	2024.08.21

Claude Code vs Codex

2025. 9. 7. 15:48

현재 Claude Code를 main으로 사용하고 있고, Codex도 이야기를 들어서 ChatGPT와 Claude에서 비교해 보았다.

ChatGPT 정리 비교표

기능 항목	Claude Code	OpenAI Codex	설명
Custom Commands	✅ 지원 (`~/.claude/commands/*.md`)	✅ 지원 (`~/.codex/prompts`)	자주 쓰는 프롬프트를 명령처럼 저장해 재사용
Sub-agent (하위 에이전트)	✅ 공식 지원 (`/agents` 명령 등)	⚠️ 실험적 (`agents.json` 기반 제한적 기능)	역할별 에이전트 구성 가능, Claude는 완성도 높음
인터넷 검색 (MCP)	✅ Claude Code 전용 MCP 연동 지원	❌ 미지원	MCP를 통해 웹에서 뉴스, 블로그, GitHub 등 직접 검색
외부 명령 실행 (Shell / API)	✅ `shell:` 및 `curl:` 스타일 명령 실행	✅ 일부 `!command` 또는 도구 인터프리터 기반	Claude는 Shell 및 웹 요청 명령을 명시적으로 구분
도구 연동 (Tool Use)	✅ 예: shell, python, web-search 등	✅ Code Interpreter 기반 도구 일부 제공	Claude는 `tool_use:` 블록으로 구조화 지원
파일 시스템 접근	✅ 제한적 허용 (명시적 권한 기반)	✅ 클라우드 세션 디렉토리 접근	둘 다 환경 내 파일 읽기/쓰기 가능
IDE 통합 (VS Code, Cursor)	❌ 없음 (CLI 기반)	✅ 공식 지원	Codex는 Cursor, VS Code와 깊게 통합됨
GitHub	⚠️ 제한적 (MCP 혹은 git command 연동 가능)	✅ `@codex` 태그 기반 자동 리뷰	PR 리뷰 워크플로우에서 차별화됨
브라우저/캘린더/메일 연동	❌ 미지원	✅ 일부 외부 앱 자동화 연동	Codex는 에이전트 기반 일정 처리 등 실험
가상 머신 샌드박스 실행	❌ 로컬 CLI 기반	✅ 클라우드 샌드박스 내 병렬 실행	안전하고 상태 유지되는 클라우드 환경 제공
상태 유지형 세션	❌ 세션 단절 (CLI 중심)	✅ 브라우저/IDE 간 상태 유지	Codex는 Cloud + ChatGPT 통합되어 멀티 환경 지원
다중 에이전트 병렬 실행	✅ sub-agent 기반 병렬 가능	⚠️ 실험적	Claude는 명시적 병렬 구조 구성 가능 (`26 agents` 사례 등)
명확한 역할 설정 (System Prompt)	✅ agent별 역할 설정 지원	✅ 가능 (대화 초기 설정 필요)	Claude는 agent마다 role/context 독립 설정
명령어 기반 CLI 인터페이스	✅ 매우 직관적 (`claude code`)	✅ Codex CLI 존재	둘 다 CLI 기반 자연어 코딩 지원
장기 실행 지원	✅ 최대 수 시간 실행 가능 (Opus 4 기준)	✅ 작업 제한 시간 존재 (최대 30분 내외)	Claude Opus 4 기준 장기 코드 흐름 유리
코드 리뷰 / 리팩토링 능력	✅ (sub-agent 활용)	✅ (Codex 자체 기능)	양측 모두 코드 리뷰/리팩터링 가능하나 스타일 차 있음
컨텍스트 분리	✅ sub-agent 마다 독립 컨텍스트	❌ 단일 세션 흐름 중심	Claude는 메인 흐름 오염 없이 세분화 가능
MCP 및 실시간 검색	✅ 다양한 MCP 검색 플러그인 연동	❌

Claude Desktop 비교

OpenAI Codex vs Claude Code 종합 비교표

🔍 핵심 아키텍처


실행 환경	클라우드 샌드박스	로컬 터미널
병렬 처리	✅ 무제한 병렬 작업	❌ 단일 세션 순차 처리
작업 지속성	✅ 1-30분 장시간 작업	⭕ 즉시 응답 기반
기반 모델	Codex-1 (o3 최적화)	Claude Opus 4.1 / Sonnet 4

🌐 인터넷 접근 & 외부 연동

기능	OpenAI Codex	Claude Code
인터넷 검색	✅ 제한적 인터넷 접근 (설정 가능)	✅ MCP를 통한 웹 검색 지원
MCP 지원	✅ CLI에서 MCP 서버 지원	✅ 네이티브 MCP 클라이언트/서버
외부 API 접근	❌ 보안상 기본 차단	✅ MCP를 통한 다양한 API 연동
실시간 데이터	⭕ 제한적 (허용 도메인만)	✅ 실시간 웹 스크래핑 가능

🤖 AI 에이전트 기능

기능	OpenAI Codex	Claude Code
Sub-agents	❌ 없음	✅ 76+ 전문화된 서브에이전트
Custom Commands	⭕ 기본적인 스크립팅	✅ 마크다운 기반 워크플로우 자동화
에이전트 자동 델리게이션	❌ 수동 작업 분배	✅ 컨텍스트 기반 자동 라우팅
독립 컨텍스트	✅ 작업별 격리된 샌드박스	✅ 서브에이전트별 독립 컨텍스트

👥 협업 및 통합

기능	OpenAI Codex	Claude Code
GitHub 통합	✅ 자동 PR 생성/리뷰/병합	⭕ 수동 Git 작업 지원
멀티디바이스 접근	✅ 웹/모바일/IDE/CLI	❌ 터미널만
원격 작업 위임	✅ @codex 태그로 GitHub에서 작업 시작	❌ 로컬에서만
팀 공유	✅ AGENTS.md + 클라우드 환경	✅ Git을 통한 설정 공유

🔧 개발자 경험

기능	OpenAI Codex	Claude Code
인터페이스	ChatGPT 사이드바 + CLI	터미널 UI
실시간 모니터링	✅ 작업 진행 상황 추적	❌ 즉시 완료 방식
작업 검증	✅ 터미널 로그 + 테스트 출력 인용	⭕ 기본적인 설명
IDE 통합	✅ VSCode, Cursor, Windsurf	⭕ MCP를 통한 제한적 통합

🛡️ 보안 및 프라이버시

기능	OpenAI Codex	Claude Code
데이터 위치	클라우드 (격리된 컨테이너)	로컬 머신
코드 전송	저장소 전체가 클라우드로	프롬프트와 컨텍스트만
네트워크 격리	✅ 완전 격리 (설정 시)	✅ 로컬 제어
MFA 요구	✅ 필수	❌ 선택사항

💰 비용 및 접근성

기능	OpenAI Codex	Claude Code
가격 모델	ChatGPT 플랜 포함 + API 토큰	Anthropic API 토큰 기반
CLI 비용	$1.50/1M 입력, $6/1M 출력	$3/1M 입력, $15/1M 출력
무료 크레딧	Plus/Pro 사용자 $5/$50	없음
오픈소스	✅ CLI는 오픈소스	✅ CLI 오픈소스

🔌 확장성 및 커스터마이징

기능	OpenAI Codex	Claude Code
MCP 생태계	✅ 제3자 MCP 서버 연결	✅ 풍부한 MCP 서버 생태계
스크립팅 능력	⭕ 기본적인 자동화	✅ Unix 철학 기반 완전 스크립팅
Hooks 시스템	❌ 없음	✅ Pre/Post 툴 사용 훅
플러그인 시스템	⭕ 제한적	✅ 커뮤니티 기반 확장

🎯 최적 사용 시나리오 (Claude Desktop)

OpenAI Codex가 우수한 경우:

🏢 대규모 팀 협업: 병렬 작업 처리와 자동 PR 관리
⏰ 장시간 작업: 30분 이상의 복잡한 리팩토링
📱 멀티디바이스: 모바일에서 작업 시작, 데스크톱에서 확인
🔄 자동화된 워크플로우: CI/CD 완전 통합
🏭 엔터프라이즈: 보안이 중요한 대기업 환경

Claude Code가 우수한 경우:

⚡ 즉시 응답: 빠른 코드 수정과 설명
🔒 로컬 제어: 코드가 외부로 나가면 안 되는 환경
👤 개인 개발: 1인 개발자의 일상적 코딩
🖥️ 터미널 중심: Vim/Emacs 사용자
🎛️ 고도 커스터마이징: 서브에이전트와 워크플로우 자동화

최적 사용 시나리오(ChatGPT)

상황	추천 도구	이유
터미널 기반 반복 작업 자동화	Claude Code	명령어/agent/검색/툴 연결 모두 CLI 구조에 최적
GitHub PR 리뷰 자동화	Codex	`@codex` 태그 한 줄로 전체 리뷰 실행
실시간 문서화 + 코드 리팩터링	Codex	프로젝트 전체 흐름을 대화형으로 처리 가능
모듈별 역할 분리된 개발 환경 구성	Claude Code	sub-agent 기반 role 분리
최신 기술 블로그/문서 분석 후 적용	Claude Code	MCP 웹 검색 후 요약 + 코드 적용
VS Code + GPT 연동 개발	Codex	IDE 통합 경험
보안/성능 분석 리포트 작성	Claude Code	markdown 기반 agent가 shell 결과까지 통합
긴 코드 흐름 제어 및 세분화된 제어	Claude Code (Opus 4)	길고 깊은 구조화 + 명시적 제어 가능
AI 개발 파트너로 전체 작업 위임	Codex	“기획 → 구현 → 테스트”까지 대화형 수행

나의 총평

아직, Codex ai는 아직 써보지 못했고, Claude Code를 열심히 쓰고 있는 입장에서 Codex는 지켜볼 도구 중 하나가 되었다.

Agentic CLI를 쓰면서, 점차 AI가 Computing System의 기반, 소위 Operating System으로 발전해 가겠구나 하는 생각이 들었다.

또 하나, 궁금한 것은 Digital Native 처럼 AI native들은 어떤 모습을 보여줄까? 기다려 지는 일이다.