콘텐츠로 이동

과제 제출 현황

학생들이 GitHub PR로 제출한 과제 현황을 정리한 페이지입니다. 제출 방법은 기여 가이드를 참조하세요.


학번W01W02W03W04W05W06W07W08
202021016제출
202021035제출제출
202121014제출제출
202321005제출제출제출
202321006제출제출제출제출제출제출제출제출
202321010제출제출제출제출제출제출
학번Lab 02Lab 03Lab 05Lab 06Lab 07Capstone
202121014제출제출제출제출제출
202321005제출
202321006제출
202321010제출
  • 제출 과제 요구사항 충족
  • 제출 제출했으나 내용 보완 필요

과제: AI 코딩 CLI(Claude Code, Gemini CLI, Codex CLI 중 선택) 설치, hello_agent.py 생성, 설치 문제 해결 기록

202021035

도구: Codex CLI (Windows)

PowerShell 실행 정책 오류(Set-ExecutionPolicy로 해결), Windows 환경변수 설정(exportset 변환). 체계적인 트러블슈팅 보고서.

202121014

도구: Codex CLI

Node.js 버전 차이(v24 vs 권장 v20) 확인 후 호환성 검증. ChatGPT 계정 로그인 방식으로 인증 선택.

202321005

도구: Claude Code

SSH 접속 시 Permission denied 해결(ssh-keygen + ssh-copy-id). CLI 설치 후 PATH 미등록 문제 해결.

202321006

도구: Codex CLI

Pygame 핀볼 게임 구현. Python 3.14 distutils 제거 이슈를 uv run --python 3.12로 해결.

202321010

도구: Gemini CLI

Week 01~04 과제를 일괄 제출. 설치 스크린샷과 hello_agent.py 포함.


Week 02: 거버넌스와 MIG 시뮬레이션

섹션 제목: “Week 02: 거버넌스와 MIG 시뮬레이션”

과제: HOTL 거버넌스, MIG 가상 시뮬레이션

202321006

FastMCP로 가상 MIG 데이터 구조 설계. RTX 3060 환경에서 MIG 미지원을 시뮬레이션으로 극복. TBAC 기반 역할별 도구 접근 제어(Professor/Student) 구현.


Week 03: MCP 서버 구현과 보안 검증

섹션 제목: “Week 03: MCP 서버 구현과 보안 검증”

과제: FastMCP 서버 구현(Tool + Resource + Prompt), MIG 프로파일 분석, 거버넌스 게이트웨이

202321005

MCP 서버(mcp_server.py) + Governed Gateway(mcp_gateway.py) 구현. MIG 분석 보고서, K8s nodeAffinity 예시, Llama-3-8B 벤치마크, TBAC/SANDWORM 보안 보고서, MCP Inspector 캡처 JSON 포함. 가장 충실한 제출.

202321006

MIG 프로파일 분할 분석(전략 A vs B 비교), TBAC 3계층 아키텍처(Mermaid 다이어그램), McpInject 공격 시뮬레이션 및 방어 전략, Llama-3-8B 4-bit VRAM 계산(~6GB), mig_monitor_server.py JSON-RPC 검증.

202321010

MCP GPU 서버, MIG 프로파일 분석, 아키텍처 문서, K8s Pod 설정 포함.


Week 04: Ralph 루프 구현 및 Test-time Compute Scaling

섹션 제목: “Week 04: Ralph 루프 구현 및 Test-time Compute Scaling”

과제: Ralph 루프 하네스(harness.sh) 구현 — backpressure, garbage collection, AGENTS.md 누적 학습

202021016

과제 내용 부족. README가 프로젝트 root README 복사본이며, AGENTS.md는 “CLAUDE.md” 한 줄만 포함. harness.sh 및 루프 구현 미제출. 보완 필요.

202021035

harness.sh(159줄) + run_task.py 구현. tasks.json 기반 태스크 큐, 3회 반복 progress 아카이브, metrics.csv 수집. AGENTS.md + PROMPT.md 분리로 역할 명확화.

202121014

harness.sh(103줄) 구현, backpressure.py, AGENTS.md(Learned Patterns + Anti-Patterns + Progress 체크리스트), PROMPT.md, 805줄 실행 로그. calculator 태스크에 대한 divide-by-zero 처리 학습 과정 기록.

202321005

가장 정교한 구현. harness.sh(335줄), backpressure.py(149줄), mock_agent.py, 4개 태스크 체크포인트, pytest 에러 로그 7건, 루프 메트릭(CSV+JSON), worktree 분석 보고서, RLM chunk 데모 실험 포함.

202321006

harness.sh(76줄) — backpressure(pytest 종료 코드), garbage collection(파일 삭제), stuck 탐지(연속 2회 실패 시 태스크 분할), 루프 메트릭 JSON 기록. 실행 로그에서 pytest: command not found로 5회 모두 실패 — 환경 설정 이슈.

202321010

autoresearch.py(167줄), harness.sh(437줄) — 가장 긴 하네스 스크립트. JSON feature list + Initializer 패턴 적용. 루프 결과 JSON, 메트릭 CSV, worktree 리포트 포함.


Week 05: 컨텍스트 관리와 토큰 최적화

섹션 제목: “Week 05: 컨텍스트 관리와 토큰 최적화”

과제: Context Manager, 토큰 카운터, Context Rot 측정 및 자동 초기화

202321006

context_manager.py 동적 컨텍스트 프루닝 + 우선순위 기반 필터링. token_counter.py Claude 모델 토큰 정확 카운팅. Context Rot을 sliding window로 완화.

202321010

토큰 카운터 통합 Ralph 루프, Context Rot 시뮬레이션 및 측정, Hybrid 자동 컨텍스트 초기화. fix_plan.md + claude-progress.txt 상태 추적. 분석 스크립트와 before/after 시각화 그래프(5종) 포함.


Week 06: 인스트럭션 튜닝과 로그 분석

섹션 제목: “Week 06: 인스트럭션 튜닝과 로그 분석”

과제: 프롬프트 개선 실험, 로그 분석, Instruction Tuning 효과 측정

202321006

PROMPT.md에 아키텍처 제약 추가로 로직 오류 30% 감소. log_analyzer.py 에이전트 추론 경로 추적, 공통 실패 지점 식별. CLAUDE.md 명시 규칙의 안정화 효과 확인.

202321010

Instruction Tuning 실험 — testset + before/after 출력 비교. 에러율 그래프, 메트릭 그래프, 에러 유형 분류 그래프 생성. lab06 하위 구조로 체계적 정리.


과제: 5단계 파이프라인형 멀티에이전트 아키텍처, JSON 아티팩트 기반 통신, 검증 게이트

202321006

5-phase gated pipeline 아키텍처 다이어그램, DAG 기반 태스크 분해 + tiered parallelization 전략, 페이즈 전환 품질 체크리스트, 3가지 실패 시나리오별 복구 전략. 스키마 4종(requirement.json, task.json, pipeline_state.json, lesson.json).

202321010

Planner → Context → Builder → Reviewer → Finalizer 5단계 파이프라인. 4개 이상 표준 JSON 스키마, DAG 의존성 그래프 + 병렬화 tier 분석, Phase별 5개 게이트 체크리스트, 3가지 시나리오 자동 복구 메커니즘.


과제: 캡스톤 프로젝트 제안서 — 문제 정의, 시스템 설계, 마일스톤

202321005 — 소크라테스 튜터

학생의 버그 코드·오답을 정답 노출 없이 질문만으로 오개념 교정하도록 유도하는 이중 루프 · 4-모듈 · 3-tier 방어 교육용 에이전트. Analysis/Dialogue/Review/Logging 모듈, Q-Critic + Validator 병렬 AND 게이트.

202321006 — 협업 넛지 에이전트

GitHub PR 발생 시 실시간 버스 팩터 계산으로 지식 독점 감지. AI 인터뷰로 설계 맥락 추출 후 적합한 팀원에게 지식 분산 유도. 퇴사 이후 발견되는 문제를 사전에 예방.

202321010 — Docs-Code Drift Detector

README/docstring/API 문서의 타입·파라미터 정의를 AST 기반으로 실제 코드와 비교하여 불일치 탐지. 문서 수정 PR 자동 생성(코드 수정은 추천만 제공).


과제: Anthropic SDK 기반 에이전트에 HOTL 거버넌스 레이어 + 감사 로그 결합

202121014

governance.py 4단계 위험 분류 + 승인 정책, agent.py Claude 제안/fallback 통과 처리, pytest 테스트, JSONL 감사 로그 예시. 설계 결정 문서화.


과제: FastMCP 기반 Tool + Resource + Prompt 3대 프리미티브, Path Traversal 방어, 안전한 subprocess 정책

202121014

filesystem/git/custom 서버 등록 설정(settings.json), 사용자 정의 MCP 서버(custom_server.py), pytest 샘플 3종. 기본 보안 요구사항 반영.


과제: 토큰 추적, Rolling Window 기반 컨텍스트 압축, 상태 저장 및 복원

202121014

python main.py 실행 시 전체 데모 자동 진행. 토큰 사용량 추적, Rolling Window 압축, 실행 상태 저장/복원, claude-progress.txt 자동 생성.


Lab 06: 프롬프트 개선 및 A/B 테스트

섹션 제목: “Lab 06: 프롬프트 개선 및 A/B 테스트”

과제: harness.log 분석, 반복 실패 패턴 추출, 프롬프트 2버전 A/B 비교

202121014

log_analyzer.py 반복 로그 에러 패턴 분류 + error_report.md 생성, 프롬프트 v1(기본)/v2(개선) 비교, ab_test.py 결과를 ab_results.json에 기록.


Lab 07: 멀티에이전트 파이프라인

섹션 제목: “Lab 07: 멀티에이전트 파이프라인”

과제: Planner → Coder 2단계 파이프라인, JSON 스키마 기반 구조화 출력

202121014

Planner/Coder 출력 JSON 스키마, base_agent.py 공통 클래스, planner_agent.py(목표→서브태스크 분해), coder_agent.py(계획→변경 내역), pipeline.py 순차 연결 실행. 설계 문서 포함.