AI 워크플로우 스킬 전략 & 안정화 설계
**속도로는 Claude와 오픈소스를 이길 수 없다.** 경쟁선을 속도에서 **깊이 · 책임 · 판단 · 검증**으로 이동시킨다.
reference docs/reference/skill.md
AI 오케스트레이션 시대에 살아남는 스킬 구조와 Claude 결과물을 안정화하는 구체적 아이디어 모음
작성 맥락: FE 시니어 + AI 오케스트레이션 아키텍트 관점, gencrew 제품군(Guard, Pipeline, AITEM) 로드맵과 연동
📌 핵심 관점
속도로는 Claude와 오픈소스를 이길 수 없다. 경쟁선을 속도에서 깊이 · 책임 · 판단 · 검증으로 이동시킨다.
"Claude보다 빠를 수 없다. 하지만 Claude + 나 가 Claude 혼자보다 더 좋을 수 있다."
1. 스킬 방향성 재검토
피해야 할 스킬 (유통기한 짧음)
- 일반 컴포넌트 스캐폴더 (shadcn/ui, v0.dev가 이김)
- 일반 CRUD / 폼 템플릿
- 단순 보일러플레이트 생성기
AI가 이미 잘하는 영역 = 스킬화 가치 낮음
투자해야 할 스킬 (오래 살아남음)
AI 시대에 오래가는 스킬의 공통 DNA
- 판단을 돕는다 (코드를 만들지 않는다)
- 맥락을 구조화한다 (맥락 자체가 자산)
- 실패 시나리오를 강제한다
- 트레이드오프를 명시한다
- 근거를 요구한다
2. 스킬 분류 체계
2-1. 2계층 컴포넌트 구조 (팀 내부용)
skills/
├── common/ # 재사용 UI — 얇게만, 내부용
│ ├── common-atoms
│ ├── common-forms
│ ├── common-data-display
│ ├── common-feedback
│ └── common-layout
└── domain/ # 도메인 화면 패턴 — 2회 이상 만들어본 것만
├── domain-auth
├── domain-admin
├── domain-chat
├── domain-rag
├── domain-agent
├── domain-payment
├── domain-education
├── domain-content
├── domain-analytics
└── domain-enterprise
원칙
- 공통 스킬은 프레임워크별로 분리 (Vue / React)
- 도메인 스킬은 공통 스킬을 참조 (의존성 방향 고정)
- 실제 2번 이상 만들어본 패턴만 스킬화
2-2. IT 전반 판단/거버넌스 스킬 (차별화 영역)
| 카테고리 | 대표 스킬 |
|---|---|
| 시스템 설계 | system-design-interviewer, capacity-planner, consistency-chooser, monolith-vs-microservice |
| SRE / 운영 | slo-sli-writer, incident-postmortem, runbook-generator, chaos-scenario |
| 보안 / 규정 | threat-model, secret-leak-auditor, auth-flow-designer, privacy-by-design |
| 성능 | perf-root-cause, db-query-optimizer, frontend-vitals-auditor, caching-strategy |
| 테스트 | test-pyramid-designer, flaky-test-hunter, contract-test-writer |
| 릴리스 | rollout-strategy, migration-planner, rollback-plan, feature-flag-hygiene |
| 코드 품질 | ai-generated-code-review, api-design-critic, error-handling-advisor |
| 레거시 | legacy-reading, strangler-fig-planner, data-migration |
| 의사결정 | adr-writer, rfc-writer, tech-radar-updater, design-doc-reviewer |
| 협업 | pr-description-writer, code-review-coach, estimation-helper |
| AI 메타 | prompt-spec, context-pack, ai-output-validator, hallucination-guard |
| 관측성 | observability-designer, log-schema, alert-hygiene, dashboard-critic |
3. 2027년 예측 — 미리 찍을 스킬
2026년 현재 "에이전트 오케스트레이션"이 주류화 중. 2027년은 그 다음 레이어의 문제들이 터진다.
5대 화두
- 다중 에이전트 협업의 충돌 조정 — 동시에 같은 코드베이스를 만지는 에이전트 간 락/트랜잭션
- AI 생성 코드의 책임/감사/보험 — Provenance, 감사 로그 표준화, AI 코드 보험
- 컨텍스트 엔지니어링이 프롬프트 엔지니어링 대체 — 무엇을 넣을지가 아니라 무엇을 뺄지
- AI가 만든 시스템의 유지보수 폭발 — 2025~2026에 쌓인 AI 기술부채가 만기
- 인간 엔지니어의 남은 역할 재정의 — 주니어 파이프라인 붕괴, AI 리터러시 평가
선점 스킬 (지금 찍으면 2027년에 효과)
A급 — 아직 아무도 깃발 안 꽂음
ai-tech-debt-auditor— AI 레거시 진단 도구, "최초 정의자" 포지션context-pruner— 컨텍스트 엔지니어링 핵심multi-agent-git-strategy— 다중 에이전트 충돌 해결
B급 — 2026 후반~2027 상반기 수요
ai-audit-trail— 규제 얘기 나오면 급등hallucinated-abstraction-finder— 구체적이고 팔기 쉬움
C급 — 장기 포지셔닝
junior-dev-curriculum— 교육 도메인 경력과 맞물림, 유튜브 소재 강함
4. Claude 결과물 안정화 — 7-Layer 전략
AI 결과물의 불안정성을 레이어별로 방어한다. 이 구조가 곧 gencrew Guard의 피처 로드맵.
안정성의 7가지 축
- 정확성 (요구사항대로 동작)
- 일관성 (스타일/패턴 통일)
- 견고성 (예외/엣지케이스)
- 검증가능성 (테스트/타입/계약)
- 변경안전성 (다른 곳 안 부숨)
- 운영가능성 (장애 추적/복구)
- 이해가능성 (6개월 뒤 읽힘)
Layer 1. 입력 단계 — Claude에게 주는 것 안정화
AI 결과 불안정성의 80%는 입력이 부실한 탓
- Context Contract — 모든 태스크에
{목표, 제약, 기존스타일샘플, 금지사항, 성공기준, 실패시나리오}6개 필수 - Style Anchor 3개 법칙 — 기존 파일 3개를 함께 주고 "이것과 일관되게"
- Negative Example Bank — 과거 잘못된 패턴 DB화, 매 요청에 "이것처럼 만들지 마"
- Constraint Pre-injection — SEED/CONSTRAINTS/DECISIONS 자동 주입 훅 (Claude Code hooks)
Layer 2. 생성 단계 — 한 번에 안 받기
- N-of-M 생성 + 비교 — 3~5번 돌려 공통 구조만 채택
- 2-Model Pincer — Claude↔GPT 교차 리뷰로 편향 상쇄
- Plan → Critique → Code — 3단계 분리, 같은 Claude라도 품질 급상승
- Incremental Scaffolding — 5~10줄씩 단계별 커밋, 각 단계 독립 검증
Layer 3. 검증 단계 — AI 코드 특유의 냄새 잡기
- Hallucination Checklist
- 존재하지 않는 import/API
- 과방어 try/catch
- 사용 안 되는 변수/함수
- 주석과 코드 불일치
- "TODO: implement" 유령 함수
- any/unknown 남발
- 복붙 흔적
- Reverse Test — AI가 만든 코드에 AI가 테스트 먼저 작성, 못 쓰면 폐기
- Semantic Diff — 단순 텍스트가 아닌 "의미 차이"로 비교
- Dependency Sanity Check — 환각 패키지/라이선스/유지보수/보안 검증
Layer 4. 통합 단계 — 코드베이스 안착
- Reversibility Gate (R0/R1/R2)
- R0: 자동 머지 OK
- R1: 사람 리뷰 필수
- R2: 아키텍트 승인 + 롤백 플랜
- AI 코드는 기본 R1 이상
- Canary Merge — 피처 플래그 뒤 1~5% 노출 후 24시간 관찰
- Blast Radius Map — 영향 범위 자동 계산, 넘으면 분할 PR 강제
- AI Code Provenance Log — 어떤 모델/프롬프트/언제 기록 (2027 규제 대응)
Layer 5. 운영 단계 — 배포 후
- AI Change Observability — AI 만진 경로에 자동 로깅/트레이싱
- Auto-rollback Trigger — 에러율/지연시간 baseline 초과 시 자동 롤백
- 2-Week Soak Rule — AI 코드는 2주간 추가 AI 수정 금지, 인간이 먼저 길들임
Layer 6. 조직 단계 — 팀/프로세스
- AI-PR 전용 리뷰 템플릿 — 일반 PR과 다른 체크리스트
- AI 커밋 Quota — 생산성이 아닌 "소화 가능량" 기준
- Paired Review — AI+인간 조합으로만 리뷰, 인간 혼자 금지
- Knowledge Recycling Loop — 발견된 버그 → Negative Example에 자동 추가
Layer 7. 메타 단계 — 안정성 자체 측정
- AI Code Quality Score — 100줄당 버그율/지적/롤백 추적
- Incident → Rule 변환 — 인시던트 발생 시 자동으로 CONSTRAINTS.md 룰 생성
- Confidence Calibration — AI 자기평가 정확도 추적, 자신감 과잉 영역 식별
5. Guard 제품 로드맵 매핑
| Layer | Guard 기능 모듈 |
|---|---|
| 1. 입력 | Context Contract 시스템, Constraint Injector |
| 2. 생성 | Cross-Model Validator, N-of-M Consensus |
| 3. 검증 | AI Hallucination Scanner, Reverse Test Enforcer |
| 4. 통합 | Reversibility Gate, Provenance Logger |
| 5. 운영 | AI-aware Observability, Auto-rollback |
| 6. 조직 | AI-PR Templates, Quality Metrics |
| 7. 메타 | AI Code Insurance Dashboard |
6. 실행 우선순위
지금 당장 (2026 Q2)
- Context Contract 템플릿 공개 —
ai-rules레포 추가, 표준 선점 - Hallucination Checklist — 유튜브 1편 ("AI 코드의 7가지 냄새")
- Reversibility Gate 데모 — R0/R1/R2 실제 PR 적용 영상, Guard 데모로 재활용
단기 (2026 하반기)
- Layer 3 검증 + Layer 4 가역성을 Guard MVP로 결합
ai-rules에 Context Pre-injection 훅 추가- 2-Model Pincer 자동화 스크립트
중기 (2027)
- A급 선점 스킬 3개 문서화 및 타임스탬프 박기
- AI Code Quality Score 측정 대시보드
- 엔터프라이즈 Provenance 로깅 표준 제안
7. 주의사항
⚠️ 함정 5가지
- 모든 레이어를 한 번에 구축하지 않는다 — 고객이 가장 아픈 3~5개부터
- "안정성 = 느려짐"으로 포지셔닝 금지 — "속도 유지 + 안 부서짐"으로
- 철학만 있고 숫자가 없으면 망함 — 버그 감소율 등 baseline 필수
- "느림"을 정당화로 끝내지 말기 — 실제로 결과물이 더 깊어야 함
- AI를 거부하면 망함 — AI를 남보다 잘 써서 속도+깊이 동시 확보
⚠️ 스킬 설계 원칙
- 처음부터 20개 만들지 말고 현재 가장 반복하는 3~5개부터
- 스킬의 진짜 가치는 목록이 아니라 내부의 구체적 실패 사례/수치/체크리스트
- 1번만 만들어본 건 패턴이 안정화 안 된 상태 — 잘못된 표준이 굳어짐
8. SKILL.md 공통 템플릿
# [스킬명]
## When to use
언제 이 스킬을 써야 하는지
## Stack assumptions
Vue 3 / React 18 / TypeScript strict / Tailwind
## Component list / Decision criteria
컴포넌트 이름 + 한 줄 설명 / 판단 기준
## Props contract / Input-Output schema
TypeScript 타입 스펙
## Accessibility / Constraints
필수 체크 항목
## Examples
실제 사용 코드 2~3개
## Anti-patterns
이렇게 쓰면 안 되는 케이스
## Failure scenarios
실패 시 어떻게 감지/복구
📋 한 줄 요약
속도는 포기. 깊이/판단/검증/책임에 집을 짓는다. Claude를 거부하지 않고, 남보다 더 잘 써서 "Claude + 나 > Claude 혼자"를 증명한다. "AI가 만든 것의 마지막 방어선" 포지션 = gencrew의 장기 해자.