세금 관련 질의응답을 도와주는 LLM 기반 Chatbot 리포지토리
Chatbot은 GPT 기반의 LLM과 RAG 구조를 활용하여 세금 관련 질문에 정확하고 신뢰할 수 있는 답변을 제공하는 챗봇 서비스입니다.
문서 기반 질의응답에서 발생하는 표현 불일치, 문맥 단절, 이미지 누락 등의 문제를 해결하며, Streamlit 기반의 UI를 통해 실시간 응답 경험을 제공합니다.
“복잡한 세금 정보, 이제는 쉽게 묻고 정확하게 답 받으세요.”
- 📚 Word 문서 기반 세금 정보 벡터화 및 질의 응답
- 🔍 키워드 사전을 활용한 표현 불일치 해결
- 🧠 LLM Evaluation (LangSmith)
- 🧾 Few-Shot Prompting을 통한 응답 형식 통일
- 💬 대화 히스토리를 반영한 문맥 기반 응답
- ☁️ Streamlit Cloud 배포 환경 대응
- LangChain / LangSmith
- OpenAI GPT (RAG 구조 기반)
- Streamlit (with stream, 세션 저장 기능)
- Pinecone (벡터 DB)
- Word 내 이미지 → Markdown 변환으로 이미지 정보 활용
- ‘사람’ → ‘거주자’ 등 표현 불일치를 해결하는 키워드 사전 도입
- 정확도 향상: Answer_helpfulness_score 0.95 → 1.00, Answer_v_reference_score 0.75 → 0.95
- 다양한 질문 시나리오 수집 → 정확성 및 hallucination 자동 분석
- 평가 결과를 기반으로 프롬프트 및 키워드 개선 루프 적용
- 답변 내 문서 출처 포함되도록 유도 → 신뢰성 있는 결과 제공
- 이전 질문 포함하여 문맥을 고려한 자연스러운 대화 흐름 지원
- 휘발성 Chroma 제거, 클라우드 기반 Pinecone 도입
- Streamlit Cloud 환경에서도 안정적 동작 확보