Skip to content

jklee3409/DocWeave

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

91 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

DocWeave

Groq API 및 로컬 임베딩 기반 PDF 문서 분석 및 RAG 챗봇

DocWeave는 고성능 Groq API와 로컬 환경에서 구동되는 임베딩 모델을 결합하여 문서를 분석하는 서비스입니다. 사용자가 PDF를 업로드하면 내용을 로컬 모델로 임베딩하여 저장하고, 이를 기반으로 질문에 대한 답변을 생성합니다.

🎯 프로젝트 개요

이 프로젝트는 Hybrid RAG (Retrieval-Augmented Generation) 파이프라인을 구현하여, 로컬 임베딩의 보안성과 클라우드 LLM의 성능을 결합해 효율적으로 문서를 분석할 수 있도록 설계되었습니다.

  • PDF 임베딩: 업로드된 문서 내용을 벡터화하여 데이터베이스에 저장
  • Hybrid AI: Groq (Llama 3.3-70b, 생성) 및 Ollama (bge-m3, 임베딩) 모델 활용
  • 문맥 기반 답변: 사용자 질문과 가장 연관된 문서 내용을 검색하여 AI 답변 생성

🛠 기술 스택

  • Backend: Java 17, Spring Boot 3.5.10, Spring AI
  • Frontend: React, Vite
  • AI Engine: Groq API (Llama 3.3-70b-versatile), Ollama (bge-m3)
  • Database: PostgreSQL (pgvector)
  • Infra: Docker Compose

🚀 실행 방법

1. Ollama 모델 설정

ollama pull bge-m3

2. 인프라 실행 (DB, Redis)

docker-compose up -d

3. 애플리케이션 실행

  • Backend: ./gradlew bootRun
  • Frontend: cd frontend && npm install && npm run dev

About

PDF 문서 분석 및 RAG 챗봇 서비스

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published