AI 코딩 에이전트 자율성 모델 비교

주요 AI 코딩 에이전트의 자율성 모델을 비교하고, ai-rules 04-workflow 모드 체계의 위치를 파악한다

guide 2026-04-03 docs/guide/AGENT_AUTONOMY_COMPARISON.md

작성일: 2026-04-03 목적: 주요 AI 코딩 에이전트의 자율성 모델을 비교하고, ai-rules 04-workflow 모드 체계의 위치를 파악한다

1. 업계 자율성 패턴 요약

업계는 크게 2가지 패턴으로 나뉜다.

패턴	대표 에이전트	특징
파일/터미널 승인 축	Claude Code, Cursor, Codex CLI, Windsurf	코드 수정·터미널 명령 승인만 제어. 커밋/푸시/배포는 에이전트 영역 밖
완전 자율 + PR 게이트	Copilot Agent, Devin, Jules	에이전트가 자유롭게 작업. PR이 유일한 승인 게이트

ai-rules의 04-workflow는 커밋/Push/PR/배포를 독립 축으로 제어하는 3번째 패턴이다. 이 방식은 다른 에이전트에서 찾기 어려운 고유 설계다.

2. 에이전트별 상세 비교

2.1 Anthropic Claude Code

공식 모드 6개 (Shift+Tab으로 순환):

모드	파일 수정	터미널 명령	비고
default	승인 필요	승인 필요	기본값
acceptEdits	자동	승인 필요
plan	금지	탐색만 허용	조사+계획 전용
auto	AI classifier 판단	classifier 판단	2026.03 출시
dontAsk	자동	자동
bypassPermissions	전부 자동	전부 자동

Auto Mode 핵심: 2개 레이어 방어 — (1) prompt injection 탐지, (2) Sonnet 4.6 기반 transcript classifier가 각 액션 실행 전 평가. 연속 3회 거부 또는 총 20회 거부 시 자동 중단 + 사람에게 escalation.

커밋/푸시/배포: Claude Code 자체에는 git workflow 자동화가 내장되어 있지 않다. CLAUDE.md + hooks로 사용자가 정의하는 구조.

2.2 GitHub Copilot Coding Agent

단일 비동기 자율 모드. 이산적 모드 구분 없음.

항목	동작
브랜치	자동 생성 (`copilot/*` 패턴만 허용)
커밋	자동 (작업 중 자동 커밋+푸시)
PR	자동 생성 (draft PR)
병합	금지 — 사람이 반드시 리뷰+승인+머지
CI/CD	사람 승인 없이 실행 안 됨

제어: AGENTS.md / .github/copilot-instructions.md로 행동 규칙 정의. Firewall으로 네트워크 접근 제한.

핵심 철학: "자율 실행 + PR 게이트" — 에이전트는 자유롭게 작업하되, 모든 결과물은 반드시 PR을 통해 사람 리뷰를 거침.

2.3 Cursor

3단계:

모드	파일 수정	터미널 명령	파일 삭제
Normal (Agent)	diff 리뷰 후 적용	미리보기 후 승인	승인 필요
YOLO Mode	자동 적용	자동 실행	자동
Plan Mode	계획만 제시	—	—

YOLO Mode: allowedCommands로 자동 승인할 명령어 패턴 설정 가능. checkpoint 자동 생성으로 전체 되돌리기 가능.

커밋/푸시: 내장 자동 커밋/푸시 없음.

2.4 Devin (Cognition)

단일 "완전 자율" 모드. 모드 구분 없음.

항목	동작
환경	독립 클라우드 VM (터미널+에디터+브라우저)
계획	자동 생성, 사용자가 편집/재정렬/승인 가능
코드 작성	완전 자율
테스트	자동 실행
커밋	자동
PR	자동 생성 (main 직접 push 안 함)
리뷰 반영	사람의 PR 코멘트에 자동 응답+반영

핵심: 작업 할당 후 방치 가능. PR 리뷰가 유일한 승인 게이트.

2.5 OpenAI Codex CLI

3단계 (가장 명확한 이산 모드):

모드	파일 읽기	파일 수정	명령 실행
suggest (기본)	자동	승인 필요	승인 필요
auto-edit	자동	자동	승인 필요
full-auto	자동	자동	자동 (샌드박스)

CLI 플래그 또는 config.toml로 설정. full-auto는 네트워크 비활성화된 샌드박스 환경에서 실행.

커밋/푸시: 내장 자동 커밋/푸시 없음. 코드 수정까지만 자율적.

2.6 Windsurf (Codeium Cascade)

터미널 명령 자동 실행 수준 4단계:

수준	설명
Disabled	모든 터미널 명령 승인 필요
Allowlist Only	허용 목록 명령만 자동 실행
Auto	deny-list 제외 모두 자동 실행
Turbo	deny-list 제외 모두 자동 실행 (관리자 허용 시만)

엔터프라이즈: 관리자가 조직 내 최대 허용 자동 실행 수준 설정 가능. .codeiumignore로 파일 접근 제한.

커밋/푸시: 내장 자동 커밋/푸시 없음.

2.7 Amazon Q Developer

2단계:

모드	설명
Automated	코드 수정을 자동 적용
Step-by-step	각 단계마다 리뷰+확인 후 적용

커밋/푸시: 에이전트가 직접 커밋/푸시하지 않음. 코드 패치를 제안하고 사용자가 수락. GitHub issue 기반 비동기 작업 시에는 PR 자동 생성.

2.8 Google Jules

단일 비동기 자율 모드 (Devin과 유사):

항목	동작
환경	보안 VM에서 repo clone 후 작업
계획	자동 생성, 사용자가 각 단계 확인/수정 가능
커밋	자동 (3가지 authorship 모드: Jules only / Co-authored / User only)
PR	자동 생성 (diff + 근거 포함)
CI 실패	자동 감지 → 수정 → 재커밋 → 재제출 루프

핵심: 비동기 설계. 계획 단계 승인이 유일한 게이트.

3. 종합 비교표

에이전트	모드 수	기본 자율성	자동 커밋	자동 PR	주요 안전장치
Claude Code	6	default (승인 필요)	X	X	AI classifier, hooks, CLAUDE.md
Copilot Agent	1	완전 자율	O	O (draft)	브랜치 제한, PR 리뷰 필수
Cursor	3	Agent (반자율)	X	X	diff 리뷰, checkpoint
Devin	1	완전 자율	O	O	PR 리뷰, Interactive Planning
Codex CLI	3	suggest (최소)	X	X	샌드박스, granular policy
Windsurf	4	Auto (반자율)	X	X	deny-list, 관리자 정책
Amazon Q	2	Step-by-step	X	X	패치 수락 게이트
Google Jules	1	완전 자율	O	O	계획 승인, authorship 제어

4. ai-rules 04-workflow 모드와의 비교

ai-rules 에이전트 작업 모드 (6단계)

모드	커밋	Push	PR	배포	AskUserQuestion
`manual`	자동	차단	차단	차단	사용
`auto`	자동	자동	자동	차단	사용
`auto-push`	자동	자동	자동	→develop	최소화 (기본)
`staging`	자동	자동	→develop	staging	최소화
`production`	자동	자동	→main	운영	최소화
`idle`	자동	자동	→develop	staging	금지

고유한 설계 포인트

특징	ai-rules	업계 일반
제어 축	커밋/Push/PR/배포를 독립 축으로 제어	파일 수정/터미널 명령 승인만 제어
배포 연동	모드에 배포 범위 포함 (develop/staging/운영)	배포는 에이전트 영역 밖
대화 제어	AskUserQuestion 수준을 모드별로 구분	대화 빈도 제어 없음
idle 모드	사람 질문 금지, 자율 판단, 3회 실패 시 자동 종료	해당 개념 없음
모드 전환	자연어 명령으로 전환	설정 UI 또는 CLI 플래그

왜 이 구조인가

Claude Code의 공식 모드는 "코드 수정 승인"만 제어한다. 커밋/푸시/배포 같은 git workflow 정책은 CLAUDE.md + hooks에 위임하는 구조다. ai-rules의 모드 체계는 이 빈 공간을 채우는 역할이다.
Copilot Agent/Devin/Jules는 "완전 자율 + PR 게이트" 단일 모드다. 이 방식은 PR 리뷰를 반드시 거치므로 안전하지만, 배포 범위나 대화 빈도를 상황별로 조절할 수 없다.
ai-rules는 상황에 따라 자율성 수준을 세밀하게 전환한다. 탐색 작업에는 auto, 집중 구현에는 auto-push, 배포 포함 작업에는 staging/production, 야간 자율 작업에는 idle — 이런 상황별 전환이 가능한 구조는 다른 에이전트에서 찾기 어렵다.

5. 업계 동향에서 배울 점

에이전트	참고할 패턴	적용 가능성
Copilot Agent	`copilot/*` 전용 브랜치 패턴으로 에이전트 작업 격리	병렬 에이전트 격리에 활용 가능
Claude Code auto	AI classifier가 각 tool call을 사전 평가	hooks + classifier 이중화 참고
Jules	3가지 authorship 모드 (Jules only / Co-authored / User only)	Co-Authored-By 규칙 확장 가능
Codex CLI	네트워크 비활성 샌드박스에서 full-auto 실행	idle 모드 안전장치 강화 참고
Windsurf	엔터프라이즈 관리자가 최대 허용 자율성 설정	팀 단위 모드 상한선 설정 아이디어
Devin	CI 실패 시 자동 감지 → 수정 → 재제출 루프	QA 에이전트 자동 재시도 패턴 참고