ai-rules handbook AI 코딩 에이전트 자율성 모델 비교

AI 코딩 에이전트 자율성 모델 비교

주요 AI 코딩 에이전트의 자율성 모델을 비교하고, ai-rules 04-workflow 모드 체계의 위치를 파악한다

guide 2026-04-03 docs/guide/AGENT_AUTONOMY_COMPARISON.md

작성일: 2026-04-03 목적: 주요 AI 코딩 에이전트의 자율성 모델을 비교하고, ai-rules 04-workflow 모드 체계의 위치를 파악한다


1. 업계 자율성 패턴 요약

업계는 크게 2가지 패턴으로 나뉜다.

패턴 대표 에이전트 특징
파일/터미널 승인 축 Claude Code, Cursor, Codex CLI, Windsurf 코드 수정·터미널 명령 승인만 제어. 커밋/푸시/배포는 에이전트 영역 밖
완전 자율 + PR 게이트 Copilot Agent, Devin, Jules 에이전트가 자유롭게 작업. PR이 유일한 승인 게이트

ai-rules의 04-workflow는 커밋/Push/PR/배포를 독립 축으로 제어하는 3번째 패턴이다. 이 방식은 다른 에이전트에서 찾기 어려운 고유 설계다.


2. 에이전트별 상세 비교

2.1 Anthropic Claude Code

공식 모드 6개 (Shift+Tab으로 순환):

모드 파일 수정 터미널 명령 비고
default 승인 필요 승인 필요 기본값
acceptEdits 자동 승인 필요
plan 금지 탐색만 허용 조사+계획 전용
auto AI classifier 판단 classifier 판단 2026.03 출시
dontAsk 자동 자동
bypassPermissions 전부 자동 전부 자동

Auto Mode 핵심: 2개 레이어 방어 — (1) prompt injection 탐지, (2) Sonnet 4.6 기반 transcript classifier가 각 액션 실행 전 평가. 연속 3회 거부 또는 총 20회 거부 시 자동 중단 + 사람에게 escalation.

커밋/푸시/배포: Claude Code 자체에는 git workflow 자동화가 내장되어 있지 않다. CLAUDE.md + hooks로 사용자가 정의하는 구조.


2.2 GitHub Copilot Coding Agent

단일 비동기 자율 모드. 이산적 모드 구분 없음.

항목 동작
브랜치 자동 생성 (copilot/* 패턴만 허용)
커밋 자동 (작업 중 자동 커밋+푸시)
PR 자동 생성 (draft PR)
병합 금지 — 사람이 반드시 리뷰+승인+머지
CI/CD 사람 승인 없이 실행 안 됨

제어: AGENTS.md / .github/copilot-instructions.md로 행동 규칙 정의. Firewall으로 네트워크 접근 제한.

핵심 철학: "자율 실행 + PR 게이트" — 에이전트는 자유롭게 작업하되, 모든 결과물은 반드시 PR을 통해 사람 리뷰를 거침.


2.3 Cursor

3단계:

모드 파일 수정 터미널 명령 파일 삭제
Normal (Agent) diff 리뷰 후 적용 미리보기 후 승인 승인 필요
YOLO Mode 자동 적용 자동 실행 자동
Plan Mode 계획만 제시

YOLO Mode: allowedCommands로 자동 승인할 명령어 패턴 설정 가능. checkpoint 자동 생성으로 전체 되돌리기 가능.

커밋/푸시: 내장 자동 커밋/푸시 없음.


2.4 Devin (Cognition)

단일 "완전 자율" 모드. 모드 구분 없음.

항목 동작
환경 독립 클라우드 VM (터미널+에디터+브라우저)
계획 자동 생성, 사용자가 편집/재정렬/승인 가능
코드 작성 완전 자율
테스트 자동 실행
커밋 자동
PR 자동 생성 (main 직접 push 안 함)
리뷰 반영 사람의 PR 코멘트에 자동 응답+반영

핵심: 작업 할당 후 방치 가능. PR 리뷰가 유일한 승인 게이트.


2.5 OpenAI Codex CLI

3단계 (가장 명확한 이산 모드):

모드 파일 읽기 파일 수정 명령 실행
suggest (기본) 자동 승인 필요 승인 필요
auto-edit 자동 자동 승인 필요
full-auto 자동 자동 자동 (샌드박스)

CLI 플래그 또는 config.toml로 설정. full-auto는 네트워크 비활성화된 샌드박스 환경에서 실행.

커밋/푸시: 내장 자동 커밋/푸시 없음. 코드 수정까지만 자율적.


2.6 Windsurf (Codeium Cascade)

터미널 명령 자동 실행 수준 4단계:

수준 설명
Disabled 모든 터미널 명령 승인 필요
Allowlist Only 허용 목록 명령만 자동 실행
Auto deny-list 제외 모두 자동 실행
Turbo deny-list 제외 모두 자동 실행 (관리자 허용 시만)

엔터프라이즈: 관리자가 조직 내 최대 허용 자동 실행 수준 설정 가능. .codeiumignore로 파일 접근 제한.

커밋/푸시: 내장 자동 커밋/푸시 없음.


2.7 Amazon Q Developer

2단계:

모드 설명
Automated 코드 수정을 자동 적용
Step-by-step 각 단계마다 리뷰+확인 후 적용

커밋/푸시: 에이전트가 직접 커밋/푸시하지 않음. 코드 패치를 제안하고 사용자가 수락. GitHub issue 기반 비동기 작업 시에는 PR 자동 생성.


2.8 Google Jules

단일 비동기 자율 모드 (Devin과 유사):

항목 동작
환경 보안 VM에서 repo clone 후 작업
계획 자동 생성, 사용자가 각 단계 확인/수정 가능
커밋 자동 (3가지 authorship 모드: Jules only / Co-authored / User only)
PR 자동 생성 (diff + 근거 포함)
CI 실패 자동 감지 → 수정 → 재커밋 → 재제출 루프

핵심: 비동기 설계. 계획 단계 승인이 유일한 게이트.


3. 종합 비교표

에이전트 모드 수 기본 자율성 자동 커밋 자동 PR 주요 안전장치
Claude Code 6 default (승인 필요) X X AI classifier, hooks, CLAUDE.md
Copilot Agent 1 완전 자율 O O (draft) 브랜치 제한, PR 리뷰 필수
Cursor 3 Agent (반자율) X X diff 리뷰, checkpoint
Devin 1 완전 자율 O O PR 리뷰, Interactive Planning
Codex CLI 3 suggest (최소) X X 샌드박스, granular policy
Windsurf 4 Auto (반자율) X X deny-list, 관리자 정책
Amazon Q 2 Step-by-step X X 패치 수락 게이트
Google Jules 1 완전 자율 O O 계획 승인, authorship 제어

4. ai-rules 04-workflow 모드와의 비교

ai-rules 에이전트 작업 모드 (6단계)

모드 커밋 Push PR 배포 AskUserQuestion
manual 자동 차단 차단 차단 사용
auto 자동 자동 자동 차단 사용
auto-push 자동 자동 자동 →develop 최소화 (기본)
staging 자동 자동 →develop staging 최소화
production 자동 자동 →main 운영 최소화
idle 자동 자동 →develop staging 금지

고유한 설계 포인트

특징 ai-rules 업계 일반
제어 축 커밋/Push/PR/배포를 독립 축으로 제어 파일 수정/터미널 명령 승인만 제어
배포 연동 모드에 배포 범위 포함 (develop/staging/운영) 배포는 에이전트 영역 밖
대화 제어 AskUserQuestion 수준을 모드별로 구분 대화 빈도 제어 없음
idle 모드 사람 질문 금지, 자율 판단, 3회 실패 시 자동 종료 해당 개념 없음
모드 전환 자연어 명령으로 전환 설정 UI 또는 CLI 플래그

왜 이 구조인가

  1. Claude Code의 공식 모드는 "코드 수정 승인"만 제어한다. 커밋/푸시/배포 같은 git workflow 정책은 CLAUDE.md + hooks에 위임하는 구조다. ai-rules의 모드 체계는 이 빈 공간을 채우는 역할이다.

  2. Copilot Agent/Devin/Jules는 "완전 자율 + PR 게이트" 단일 모드다. 이 방식은 PR 리뷰를 반드시 거치므로 안전하지만, 배포 범위나 대화 빈도를 상황별로 조절할 수 없다.

  3. ai-rules는 상황에 따라 자율성 수준을 세밀하게 전환한다. 탐색 작업에는 auto, 집중 구현에는 auto-push, 배포 포함 작업에는 staging/production, 야간 자율 작업에는 idle — 이런 상황별 전환이 가능한 구조는 다른 에이전트에서 찾기 어렵다.


5. 업계 동향에서 배울 점

에이전트 참고할 패턴 적용 가능성
Copilot Agent copilot/* 전용 브랜치 패턴으로 에이전트 작업 격리 병렬 에이전트 격리에 활용 가능
Claude Code auto AI classifier가 각 tool call을 사전 평가 hooks + classifier 이중화 참고
Jules 3가지 authorship 모드 (Jules only / Co-authored / User only) Co-Authored-By 규칙 확장 가능
Codex CLI 네트워크 비활성 샌드박스에서 full-auto 실행 idle 모드 안전장치 강화 참고
Windsurf 엔터프라이즈 관리자가 최대 허용 자율성 설정 팀 단위 모드 상한선 설정 아이디어
Devin CI 실패 시 자동 감지 → 수정 → 재제출 루프 QA 에이전트 자동 재시도 패턴 참고

6. 출처