Skip to content

[Feature] 뉴스 텍스트 내 기업 이벤트 식별 및 구조화 모듈 구현 #2

@minju00

Description

@minju00

✨ 제안하는 기능 요약

SENTiVENT 논문의 방법을 벤치마킹하여, 비정형 한국 증시 뉴스 텍스트에서 가치 있는 "기업 이벤트"를 선별하고 핵심 정보(주체, 시점, 내용 등)를 정형 데이터(JSON)로 구조화하는 AI 모듈을 구현합니다.


🧩 왜 필요한가요?

현재 뉴스 데이터는 단순히 줄글 형태라 DB에 적재하고 관계 데이터를 추출하기 힘듭니다.
누가(Company), 언제(Date), 무엇을(Event Type), 얼마나(Value) 등의 정형 데이터로 변환이 필요합니다.

해외 경제 이벤트 추출 연구인 "SENTiVENT"의 접근법을 이용하여, 기술적 타당성과 추출 성능을 확보하고자 합니다.


🎯 구체적인 동작 방식 제안 (선택)

  • Step 1: Event Sentence Classification (필터링)
  • Step 2: Fine-grained Information Extraction (정보 추출)
  • 추출 스키마(Schema):
company: 이벤트 주체 (Ticker/종목명)
target: 대상 기업 또는 객체
value: 관련 금액 또는 수치 
date: 발생 시점
trigger_word: 근거가 되는 핵심 단어

📁 참고 자료 / 관련 이슈 (선택)


✔ 체크리스트

  • 팀원과 사전 논의함
  • 구현 영향 범위 파악함
  • 테스트 방법 고려함

Metadata

Metadata

Assignees

Labels

enhancementNew feature or request

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions