AI 코딩 에이전트 자율성 모델 비교
주요 AI 코딩 에이전트의 자율성 모델을 비교하고, ai-rules 04-workflow 모드 체계의 위치를 파악한다
작성일: 2026-04-03 목적: 주요 AI 코딩 에이전트의 자율성 모델을 비교하고, ai-rules 04-workflow 모드 체계의 위치를 파악한다
1. 업계 자율성 패턴 요약
업계는 크게 2가지 패턴으로 나뉜다.
| 패턴 | 대표 에이전트 | 특징 |
|---|---|---|
| 파일/터미널 승인 축 | Claude Code, Cursor, Codex CLI, Windsurf | 코드 수정·터미널 명령 승인만 제어. 커밋/푸시/배포는 에이전트 영역 밖 |
| 완전 자율 + PR 게이트 | Copilot Agent, Devin, Jules | 에이전트가 자유롭게 작업. PR이 유일한 승인 게이트 |
ai-rules의 04-workflow는 커밋/Push/PR/배포를 독립 축으로 제어하는 3번째 패턴이다. 이 방식은 다른 에이전트에서 찾기 어려운 고유 설계다.
2. 에이전트별 상세 비교
2.1 Anthropic Claude Code
공식 모드 6개 (Shift+Tab으로 순환):
| 모드 | 파일 수정 | 터미널 명령 | 비고 |
|---|---|---|---|
| default | 승인 필요 | 승인 필요 | 기본값 |
| acceptEdits | 자동 | 승인 필요 | |
| plan | 금지 | 탐색만 허용 | 조사+계획 전용 |
| auto | AI classifier 판단 | classifier 판단 | 2026.03 출시 |
| dontAsk | 자동 | 자동 | |
| bypassPermissions | 전부 자동 | 전부 자동 |
Auto Mode 핵심: 2개 레이어 방어 — (1) prompt injection 탐지, (2) Sonnet 4.6 기반 transcript classifier가 각 액션 실행 전 평가. 연속 3회 거부 또는 총 20회 거부 시 자동 중단 + 사람에게 escalation.
커밋/푸시/배포: Claude Code 자체에는 git workflow 자동화가 내장되어 있지 않다. CLAUDE.md + hooks로 사용자가 정의하는 구조.
2.2 GitHub Copilot Coding Agent
단일 비동기 자율 모드. 이산적 모드 구분 없음.
| 항목 | 동작 |
|---|---|
| 브랜치 | 자동 생성 (copilot/* 패턴만 허용) |
| 커밋 | 자동 (작업 중 자동 커밋+푸시) |
| PR | 자동 생성 (draft PR) |
| 병합 | 금지 — 사람이 반드시 리뷰+승인+머지 |
| CI/CD | 사람 승인 없이 실행 안 됨 |
제어: AGENTS.md / .github/copilot-instructions.md로 행동 규칙 정의. Firewall으로 네트워크 접근 제한.
핵심 철학: "자율 실행 + PR 게이트" — 에이전트는 자유롭게 작업하되, 모든 결과물은 반드시 PR을 통해 사람 리뷰를 거침.
2.3 Cursor
3단계:
| 모드 | 파일 수정 | 터미널 명령 | 파일 삭제 |
|---|---|---|---|
| Normal (Agent) | diff 리뷰 후 적용 | 미리보기 후 승인 | 승인 필요 |
| YOLO Mode | 자동 적용 | 자동 실행 | 자동 |
| Plan Mode | 계획만 제시 | — | — |
YOLO Mode: allowedCommands로 자동 승인할 명령어 패턴 설정 가능. checkpoint 자동 생성으로 전체 되돌리기 가능.
커밋/푸시: 내장 자동 커밋/푸시 없음.
2.4 Devin (Cognition)
단일 "완전 자율" 모드. 모드 구분 없음.
| 항목 | 동작 |
|---|---|
| 환경 | 독립 클라우드 VM (터미널+에디터+브라우저) |
| 계획 | 자동 생성, 사용자가 편집/재정렬/승인 가능 |
| 코드 작성 | 완전 자율 |
| 테스트 | 자동 실행 |
| 커밋 | 자동 |
| PR | 자동 생성 (main 직접 push 안 함) |
| 리뷰 반영 | 사람의 PR 코멘트에 자동 응답+반영 |
핵심: 작업 할당 후 방치 가능. PR 리뷰가 유일한 승인 게이트.
2.5 OpenAI Codex CLI
3단계 (가장 명확한 이산 모드):
| 모드 | 파일 읽기 | 파일 수정 | 명령 실행 |
|---|---|---|---|
| suggest (기본) | 자동 | 승인 필요 | 승인 필요 |
| auto-edit | 자동 | 자동 | 승인 필요 |
| full-auto | 자동 | 자동 | 자동 (샌드박스) |
CLI 플래그 또는 config.toml로 설정. full-auto는 네트워크 비활성화된 샌드박스 환경에서 실행.
커밋/푸시: 내장 자동 커밋/푸시 없음. 코드 수정까지만 자율적.
2.6 Windsurf (Codeium Cascade)
터미널 명령 자동 실행 수준 4단계:
| 수준 | 설명 |
|---|---|
| Disabled | 모든 터미널 명령 승인 필요 |
| Allowlist Only | 허용 목록 명령만 자동 실행 |
| Auto | deny-list 제외 모두 자동 실행 |
| Turbo | deny-list 제외 모두 자동 실행 (관리자 허용 시만) |
엔터프라이즈: 관리자가 조직 내 최대 허용 자동 실행 수준 설정 가능. .codeiumignore로 파일 접근 제한.
커밋/푸시: 내장 자동 커밋/푸시 없음.
2.7 Amazon Q Developer
2단계:
| 모드 | 설명 |
|---|---|
| Automated | 코드 수정을 자동 적용 |
| Step-by-step | 각 단계마다 리뷰+확인 후 적용 |
커밋/푸시: 에이전트가 직접 커밋/푸시하지 않음. 코드 패치를 제안하고 사용자가 수락. GitHub issue 기반 비동기 작업 시에는 PR 자동 생성.
2.8 Google Jules
단일 비동기 자율 모드 (Devin과 유사):
| 항목 | 동작 |
|---|---|
| 환경 | 보안 VM에서 repo clone 후 작업 |
| 계획 | 자동 생성, 사용자가 각 단계 확인/수정 가능 |
| 커밋 | 자동 (3가지 authorship 모드: Jules only / Co-authored / User only) |
| PR | 자동 생성 (diff + 근거 포함) |
| CI 실패 | 자동 감지 → 수정 → 재커밋 → 재제출 루프 |
핵심: 비동기 설계. 계획 단계 승인이 유일한 게이트.
3. 종합 비교표
| 에이전트 | 모드 수 | 기본 자율성 | 자동 커밋 | 자동 PR | 주요 안전장치 |
|---|---|---|---|---|---|
| Claude Code | 6 | default (승인 필요) | X | X | AI classifier, hooks, CLAUDE.md |
| Copilot Agent | 1 | 완전 자율 | O | O (draft) | 브랜치 제한, PR 리뷰 필수 |
| Cursor | 3 | Agent (반자율) | X | X | diff 리뷰, checkpoint |
| Devin | 1 | 완전 자율 | O | O | PR 리뷰, Interactive Planning |
| Codex CLI | 3 | suggest (최소) | X | X | 샌드박스, granular policy |
| Windsurf | 4 | Auto (반자율) | X | X | deny-list, 관리자 정책 |
| Amazon Q | 2 | Step-by-step | X | X | 패치 수락 게이트 |
| Google Jules | 1 | 완전 자율 | O | O | 계획 승인, authorship 제어 |
4. ai-rules 04-workflow 모드와의 비교
ai-rules 에이전트 작업 모드 (6단계)
| 모드 | 커밋 | Push | PR | 배포 | AskUserQuestion |
|---|---|---|---|---|---|
manual |
자동 | 차단 | 차단 | 차단 | 사용 |
auto |
자동 | 자동 | 자동 | 차단 | 사용 |
auto-push |
자동 | 자동 | 자동 | →develop | 최소화 (기본) |
staging |
자동 | 자동 | →develop | staging | 최소화 |
production |
자동 | 자동 | →main | 운영 | 최소화 |
idle |
자동 | 자동 | →develop | staging | 금지 |
고유한 설계 포인트
| 특징 | ai-rules | 업계 일반 |
|---|---|---|
| 제어 축 | 커밋/Push/PR/배포를 독립 축으로 제어 | 파일 수정/터미널 명령 승인만 제어 |
| 배포 연동 | 모드에 배포 범위 포함 (develop/staging/운영) | 배포는 에이전트 영역 밖 |
| 대화 제어 | AskUserQuestion 수준을 모드별로 구분 | 대화 빈도 제어 없음 |
| idle 모드 | 사람 질문 금지, 자율 판단, 3회 실패 시 자동 종료 | 해당 개념 없음 |
| 모드 전환 | 자연어 명령으로 전환 | 설정 UI 또는 CLI 플래그 |
왜 이 구조인가
Claude Code의 공식 모드는 "코드 수정 승인"만 제어한다. 커밋/푸시/배포 같은 git workflow 정책은 CLAUDE.md + hooks에 위임하는 구조다. ai-rules의 모드 체계는 이 빈 공간을 채우는 역할이다.
Copilot Agent/Devin/Jules는 "완전 자율 + PR 게이트" 단일 모드다. 이 방식은 PR 리뷰를 반드시 거치므로 안전하지만, 배포 범위나 대화 빈도를 상황별로 조절할 수 없다.
ai-rules는 상황에 따라 자율성 수준을 세밀하게 전환한다. 탐색 작업에는
auto, 집중 구현에는auto-push, 배포 포함 작업에는staging/production, 야간 자율 작업에는idle— 이런 상황별 전환이 가능한 구조는 다른 에이전트에서 찾기 어렵다.
5. 업계 동향에서 배울 점
| 에이전트 | 참고할 패턴 | 적용 가능성 |
|---|---|---|
| Copilot Agent | copilot/* 전용 브랜치 패턴으로 에이전트 작업 격리 |
병렬 에이전트 격리에 활용 가능 |
| Claude Code auto | AI classifier가 각 tool call을 사전 평가 | hooks + classifier 이중화 참고 |
| Jules | 3가지 authorship 모드 (Jules only / Co-authored / User only) | Co-Authored-By 규칙 확장 가능 |
| Codex CLI | 네트워크 비활성 샌드박스에서 full-auto 실행 | idle 모드 안전장치 강화 참고 |
| Windsurf | 엔터프라이즈 관리자가 최대 허용 자율성 설정 | 팀 단위 모드 상한선 설정 아이디어 |
| Devin | CI 실패 시 자동 감지 → 수정 → 재제출 루프 | QA 에이전트 자동 재시도 패턴 참고 |