BlogToBook

블로그 포스트를 전자책으로 변환하는 웹 서비스입니다.

데모

웹사이트에서 바로 사용해보세요: BlogToBook

특징

간단한 사용법: URL만 붙여넣으면 전자책 완성
다양한 포맷: EPUB과 PDF 지원
실시간 진행상황: 변환 과정을 실시간으로 확인
복수 포스트 지원: 여러 글을 하나의 전자책으로 묶기
로그인 불필요: 회원가입 없이 바로 사용

지원 플랫폼

Brunch (브런치)
Tistory (티스토리)
Jekyll 기반 블로그

사용법

전자책 포맷 선택 (EPUB/PDF)
책 제목 입력
블로그 포스트 URL 입력
'전자책 만들기' 클릭
변환 완료 후 다운로드

전자책 변환 프로세스

flowchart LR
    A[📝 사용자 입력<br/>URL & 제목] --> B[🔍 콘텐츠 추출<br/>웹페이지 분석]
    B --> C[🛠️ HTML 전처리<br/>태그 정리 & 구조화]
    C --> D[🖼️ 이미지 처리<br/>다운로드 & 최적화]
    D --> E[📖 전자책 생성<br/>EPUB/PDF 변환]
    E --> F[📥 다운로드<br/>완성된 전자책]
    
    style A fill:#e3f2fd,stroke:#1976d2,stroke-width:3px,color:#000
    style B fill:#f3e5f5,stroke:#7b1fa2,stroke-width:3px,color:#000
    style C fill:#e8f5e8,stroke:#388e3c,stroke-width:3px,color:#000
    style D fill:#fff3e0,stroke:#f57c00,stroke-width:3px,color:#000
    style E fill:#fce4ec,stroke:#c2185b,stroke-width:3px,color:#000
    style F fill:#e0f2f1,stroke:#00695c,stroke-width:3px,color:#000

🔧 기술적 구현 흐름

flowchart TD
    subgraph "1️⃣ 웹 콘텐츠 추출"
        A1[Trafilatura<br/>라이브러리]
        A2[본문 텍스트 추출]
        A3[불필요한 요소 제거]
        A1 --> A2 --> A3
    end
    
    subgraph "2️⃣ HTML 전처리"
        B1[BeautifulSoup4<br/>파싱]
        B2[태그 구조 정리]
        B3[코드 블록 처리]
        B1 --> B2 --> B3
    end
    
    subgraph "3️⃣ 이미지 처리"
        C1[이미지 URL 추출]
        C2[비동기 다운로드<br/>aiohttp]
        C3[로컬 경로로 변경]
        C1 --> C2 --> C3
    end
    
    subgraph "4️⃣ 전자책 변환"
        D1[Calibre<br/>ebook-convert]
        D2[CSS 스타일 적용]
        D3[최종 파일 생성]
        D1 --> D2 --> D3
    end
    
    A3 --> B1
    B3 --> C1
    C3 --> D1
    
    style A1 fill:#e3f2fd,color:#000
    style B1 fill:#f3e5f5,color:#000
    style C2 fill:#fff3e0,color:#000
    style D1 fill:#fce4ec,color:#000

변환 과정 상세

콘텐츠 추출
- Trafilatura를 사용하여 웹페이지에서 본문 추출
- 광고, 내비게이션 등 불필요한 요소 제거
- HTML 형식으로 구조화된 콘텐츠 생성
이미지 처리
- 모든 이미지를 비동기적으로 다운로드
- 이미지 파일을 로컬에 저장
- HTML 내 이미지 링크를 로컬 경로로 변경
문서 구조화
- 제목 구조 분석 및 목차 생성
- 코드 블록 및 인용문 스타일링
- 폰트 및 CSS 스타일 적용
전자책 변환
- Calibre를 사용하여 HTML을 전자책 포맷으로 변환
- 메타데이터 추가 (제목, 저자 등)
- 최종 파일 생성

기술 스택

Backend

FastAPI
Trafilatura (콘텐츠 추출)
Calibre (전자책 변환)
aiohttp (이미지 다운로드)

Frontend

Vanilla JavaScript
Bulma CSS
Server-Sent Events

프로젝트 구조

BlogToBook/
├── app/
│   ├── main.py                    # 애플리케이션 진입점
│   ├── api/v1/endpoints/          # API 엔드포인트
│   ├── services/                  # 비즈니스 로직
│   │   ├── content/              # 콘텐츠 추출
│   │   ├── converter/            # 전자책 변환
│   │   └── image/                # 이미지 처리
│   ├── static/                   # CSS, 폰트
│   └── view/templates/           # HTML 템플릿
├── output/                       # 생성된 전자책
└── pyproject.toml               # 프로젝트 설정

로드맵

라이선스

이 프로젝트는 MIT 라이선스 하에 있습니다.

연락처

koesnam.dev@gmail.com

Name		Name	Last commit message	Last commit date
Latest commit History 38 Commits
.github/workflows		.github/workflows
app		app
.gitignore		.gitignore
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
deploy.sh		deploy.sh
pyproject.toml		pyproject.toml
pyrightconfig.json		pyrightconfig.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

BlogToBook

데모

특징

지원 플랫폼

사용법

전자책 변환 프로세스

🔧 기술적 구현 흐름

변환 과정 상세

기술 스택

프로젝트 구조

로드맵

라이선스

연락처

About

Uh oh!

Uh oh!

Languages

License

10kseok/BlogToBook

Folders and files

Latest commit

History

Repository files navigation

BlogToBook

데모

특징

지원 플랫폼

사용법

전자책 변환 프로세스

🔧 기술적 구현 흐름

변환 과정 상세

기술 스택

프로젝트 구조

로드맵

라이선스

연락처

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Uh oh!

Languages