Lab 02: 첫 번째 AI 코딩 에이전트

초급 마감: 2026-03-17

목표

anthropic Python SDK를 사용한 첫 번째 에이전트 구현
4단계 위험 분류(LOW, MEDIUM, HIGH, CRITICAL)가 있는 HOTL 거버넌스 레이어 구현
JSON Lines 형식의 구조화된 감사 로그 시스템 구축
정책 테스트로 거버넌스 로직 검증

환경 설정

mkdir lab-02 && cd lab-02
python -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate
pip install anthropic python-dotenv pytest

구현 요구사항

1. `governance.py` — 거버넌스 레이어

from enum import Enum
import json
import sys
from datetime import datetime, timezone


class ActionRisk(Enum):
    LOW = "low"
    MEDIUM = "medium"
    HIGH = "high"
    CRITICAL = "critical"


def log_action(action: str, risk: ActionRisk, approved: bool,
               reason: str = "") -> dict:
    """JSON Lines 형식으로 감사 로그를 기록한다."""
    entry = {
        "timestamp": datetime.now(timezone.utc).isoformat(),
        "action": action[:100],
        "risk": risk.value,
        "approved": approved,
        "reason": reason,
    }
    with open("audit.jsonl", "a") as f:
        f.write(json.dumps(entry, ensure_ascii=False) + "\n")
    return entry


def require_human_approval(action: str) -> bool:
    """HIGH 위험 액션에 대해 사용자 승인을 요청한다."""
    print(f"\n⚠️  HIGH RISK ACTION 감지:\n{action}\n")
    response = input("승인하시겠습니까? (yes/no): ")
    return response.lower() == "yes"


def governance_check(action: str, risk: ActionRisk) -> bool:
    """위험 수준에 따라 액션을 허용/거부한다."""
    # CRITICAL: 무조건 거부
    if risk == ActionRisk.CRITICAL:
        log_action(action, risk, False, reason="CRITICAL 자동 거부")
        print(f"\n🚫 CRITICAL ACTION 자동 거부: {action[:50]}")
        return False

    # HIGH: 인간 승인 필요
    if risk == ActionRisk.HIGH:
        approved = require_human_approval(action)
        log_action(action, risk, approved,
                   reason="인간 승인" if approved else "인간 거부")
        return approved

    # LOW, MEDIUM: 자동 승인
    log_action(action, risk, True, reason="자동 승인")
    return True

2. `agent.py` — 에이전트 메인 루프

거버넌스 레이어를 통합한 Claude API 호출 에이전트를 구현한다.

3. `test_governance.py` — 정책 테스트

import json
from pathlib import Path
from governance import ActionRisk, governance_check, log_action

AUDIT_FILE = "audit.jsonl"


def setup_function():
    """각 테스트 전 감사 로그 초기화."""
    Path(AUDIT_FILE).unlink(missing_ok=True)


def test_critical_always_denied():
    """CRITICAL 위험은 항상 거부되어야 한다."""
    result = governance_check("rm -rf /", ActionRisk.CRITICAL)
    assert result is False
    logs = Path(AUDIT_FILE).read_text().strip().split("\n")
    entry = json.loads(logs[-1])
    assert entry["approved"] is False
    assert entry["risk"] == "critical"


def test_low_auto_approved():
    """LOW 위험은 자동 승인되어야 한다."""
    result = governance_check("파일 읽기", ActionRisk.LOW)
    assert result is True
    logs = Path(AUDIT_FILE).read_text().strip().split("\n")
    entry = json.loads(logs[-1])
    assert entry["approved"] is True


def test_audit_log_is_jsonl():
    """감사 로그가 유효한 JSON Lines 형식이어야 한다."""
    log_action("test action", ActionRisk.LOW, True)
    log_action("test action 2", ActionRisk.MEDIUM, True)
    logs = Path(AUDIT_FILE).read_text().strip().split("\n")
    assert len(logs) == 2
    for line in logs:
        entry = json.loads(line)  # 파싱 실패 시 테스트 실패
        assert "timestamp" in entry
        assert "action" in entry
        assert "risk" in entry

코드 구현 (governance.py, agent.py)
python agent.py로 실행 테스트
HIGH risk 액션 실행 시 Hard Interrupt 동작 확인
CRITICAL risk 액션이 자동 거부되는지 확인
pytest test_governance.py -v로 정책 테스트 통과 확인
audit.jsonl 내용이 유효한 JSON Lines인지 확인
PR 제출

제출물

assignments/lab-02/[학번]/에 PR:

governance.py — 4단계 위험 분류 + JSON Lines 로깅
agent.py — 거버넌스 통합 에이전트
test_governance.py — 정책 테스트 (최소 3개)
audit.jsonl 예시 — 최소 5개 액션 기록 (유효한 JSON Lines)
README.md — 설계 결정 및 테스트 결과

Lab 02: 첫 번째 AI 코딩 에이전트

목표

환경 설정

구현 요구사항

1. governance.py — 거버넌스 레이어

2. agent.py — 에이전트 메인 루프

3. test_governance.py — 정책 테스트

제출물

1. `governance.py` — 거버넌스 레이어

2. `agent.py` — 에이전트 메인 루프

3. `test_governance.py` — 정책 테스트