-
Notifications
You must be signed in to change notification settings - Fork 0
Open
Labels
enhancementNew feature or requestNew feature or request
Description
✨ 제안하는 기능 요약
SENTiVENT 논문의 방법을 벤치마킹하여, 비정형 한국 증시 뉴스 텍스트에서 가치 있는 "기업 이벤트"를 선별하고 핵심 정보(주체, 시점, 내용 등)를 정형 데이터(JSON)로 구조화하는 AI 모듈을 구현합니다.
🧩 왜 필요한가요?
현재 뉴스 데이터는 단순히 줄글 형태라 DB에 적재하고 관계 데이터를 추출하기 힘듭니다.
누가(Company), 언제(Date), 무엇을(Event Type), 얼마나(Value) 등의 정형 데이터로 변환이 필요합니다.
해외 경제 이벤트 추출 연구인 "SENTiVENT"의 접근법을 이용하여, 기술적 타당성과 추출 성능을 확보하고자 합니다.
🎯 구체적인 동작 방식 제안 (선택)
- Step 1: Event Sentence Classification (필터링)
- Step 2: Fine-grained Information Extraction (정보 추출)
- 추출 스키마(Schema):
company: 이벤트 주체 (Ticker/종목명)
target: 대상 기업 또는 객체
value: 관련 금액 또는 수치
date: 발생 시점
trigger_word: 근거가 되는 핵심 단어
📁 참고 자료 / 관련 이슈 (선택)
- 관련 이슈: #
- 문서 링크: https://link.springer.com/article/10.1007/s10579-021-09562-4#:~:text=state,%E2%80%9CLegal%E2%80%9D%2C%20%E2%80%9CAnalyst
✔ 체크리스트
- 팀원과 사전 논의함
- 구현 영향 범위 파악함
- 테스트 방법 고려함
Metadata
Metadata
Assignees
Labels
enhancementNew feature or requestNew feature or request