사내 AI 개발 플랫폼 아키텍처 제안서

Generated from prompt:

사내 AI 개발 플랫폼 아키텍처 제안서 Qwen 기반 온프레미스 바이브 코딩 플랫폼 1. 프로젝트 개요 목표 사내 개발 규칙 및 코드 스타일을 학습한 AI 개발 보조 시스템 구축 주요 목적: 사내 코딩 컨벤션 자동 적용 프로젝트 구조 이해 사내 프레임워크 사용 규칙 학습 코드 생성 품질 표준화 신규 개발자 온보딩 지원 생산성 향상 2. 구축 방향 핵심 전략 Fine-tuning + RAG Hybrid 구조 구성 목적: 기능 방식 최신 코드 이해 RAG 개발 규칙 학습 Fine-tuning 코드 생성 Qwen3.5 프로젝트 구조 이해 Vector Search IDE 연동 VSCode Extension 3. 전체 아키텍처 ┌──────────────────────┐ │ Developer IDE │ │ VSCode / JetBrains │ └─────────┬────────────┘ │ ▼ ┌──────────────────────┐ │ Internal AI Gateway │ │ Auth / Prompt Route │ └─────────┬────────────┘ │ ┌────────┴────────┐ ▼ ▼ ┌────────────────┐ ┌────────────────┐ │ Qwen3.5 Server │ │ RAG Engine │ │ vLLM │ │ Retrieval API │ └──────┬─────────┘ └──────┬─────────┘ │ │ ▼ ▼ ┌────────────────┐ ┌────────────────┐ │ Fine-tuned LoRA│ │ Qdrant │ │ Adapter │ │ Vector DB │ └────────────────┘ └──────┬─────────┘ │ ▼ ┌────────────────┐ │ GitLab │ │ Wiki │ │ Confluence │ └────────────────┘ 4. 핵심 구성 요소 4-1. LLM Inference Layer 구성 항목 선택 모델 Qwen3.5-Coder Inference Engine vLLM GPU NVIDIA H100 Serving 방식 OpenAI API Compatible 역할 코드 생성 코드 리팩토링 규칙 기반 응답 문서 생성 4-2. RAG 시스템 목적 실시간 사내 코드/문서 검색 데이터 소스 GitLab Repository API 문서 사내 Wiki 공통 라이브러리 아키텍처 문서 동작 흐름 사용자 질문 → Embedding 생성 → Qdrant 검색 → 관련 코드 추출 → Prompt Context 삽입 → Qwen 응답 생성 5. Fine-tuning 전략 목표 사내 개발 규칙 학습 예시: 네이밍 규칙 Layer 구조 Exception 처리 방식 Logging 방식 DTO 구조 API 응답 포맷 테스트 코드 스타일 학습 방식 QLoRA 기반 PEFT 학습 이유 항목 장점 GPU 효율 높음 학습 비용 낮음 재학습 속도 빠름 유지보수 용이 6. 데이터 파이프라인 전체 흐름 GitLab ↓ Code Parser ↓ Chunking ↓ Embedding ↓ Qdrant 저장 코드 파싱 단위 언어 단위 Java Class / Method Python Function JS/TS Module Spring Controller / Service 7. 학습 데이터 구조 예시 { "instruction": "회원 조회 API 작성", "input": "사내 공통 Response DTO 사용", "output": "회사 규칙에 맞는 코드" } 8. 서버 인프라 AI 서버 구성 항목 스펙 GPU H100 80GB x2 CPU EPYC / Xeon RAM 512GB Storage NVMe 8TB OS Ubuntu Server 예상 역할 분리 서버 역할 AI-01 vLLM AI-02 RAG / Embedding AI-03 학습 서버 9. 개발자 사용 흐름 IDE 질문 ↓ 사내 API 규칙 조회 ↓ 관련 코드 검색 ↓ Qwen Context 생성 ↓ 규칙 기반 코드 생성 ↓ IDE 반환 10. 예상 기능 1차 목표 코드 자동완성 사내 규칙 기반 코드 생성 API 템플릿 생성 테스트 코드 생성 코드 설명 2차 목표 PR 리뷰 자동화 리팩토링 제안 장애 원인 분석 로그 분석 배포 스크립트 생성 11. 보안 구조 내부망 기반 운영 Internet 차단 ↓ 내부 Git 접근 ↓ 내부 AI API 호출 ↓ 사내 인증 연동 주요 보안 정책 외부 API 차단 모델 내부망 배포 Prompt Logging 사용자 권한 분리 Repository 접근 권한 연동 12. 운영 전략 모델 운영 항목 방식 모델 업데이트 분기별 임베딩 재생성 일별 Git 동기화 실시간 로그 수집 ELK 13. MLOps / LLMOps 구성 요소 영역 기술 모델 서빙 vLLM 학습 HuggingFace Pipeline Airflow 모니터링 Prometheus 로그 Grafana / ELK 14. 예상 기대 효과 항목 효과 생산성 코드 작성 시간 감소 품질 코드 표준화 온보딩 신규 인력 적응 시간 단축 유지보수 코드 이해도 향상 리뷰 비용 감소 15. 구축 로드맵 Phase 1 — PoC 기간: 1~2개월 Qwen3.5 구축 vLLM 구성 GitLab 연동 기본 RAG 구축 Phase 2 — 사내 적용 기간: 3~4개월 Fine-tuning IDE Extension 사용자 인증 운영 모니터링 Phase 3 — AI Agent 고도화 기간: 6개월+ PR 리뷰 자동화 배포 자동화 장애 대응 Agent 테스트 자동 생성 16. 최종 제안 추천 방향 Qwen3.5 + vLLM + Qdrant + LoRA 핵심 성공 요소 코드 품질 표준화 문서 체계화 RAG 품질 Prompt Engineering Fine-tuning 데이터 품질 17. 결론 본 프로젝트는 단순 AI 도입이 아니라: "사내 개발 지식을 학습하는 개발 플랫폼 구축" 을 목표로 해야 함. 성공 시: 개발 생산성 향상 코드 품질 표준화 사내 기술 자산 축적 AI 기반 개발 문화 정착 효과를 기대할 수 있음.

이 제안서는 사내 개발 규칙 및 코드 스타일을 학습하는 인공지능 개발 보조 시스템 구축을 목표로 합니다. Qwen 기반의 온프레미스 플랫폼 아키텍처를 제시하며, Fine-tuning과 RAG 하이브리드 구조를 통해 최신 코드 이해 및 개발 규칙 학습을 구현합니다. 코드 생성 품질 표준화, 신규 개발자 온보딩 지원, 그리고 전반적인 개발 생산성 향상을 위한 핵심 구성 요소, 데이터 파이프라인, 그리고 인프라 구성을 상세히 설명합니다.

May 20, 202618 slides