Bu proje, video tabanlı bir uygulama için backend pipeline sunmaktadır. Pipeline, metinden videoya, videodan altyazıya, embedding ve öneri sistemine kadar uçtan uca destek sağlar. Backend, farklı AI servisleri ve araçlarla entegre çalışacak şekilde tasarlanmıştır.
Bu proje, öncelikli olarak ODAK uygulamasının backend kısmını yönetmek için geliştirilmiştir. Diğer servisler (frontend, mobil uygulama vb.) eklenerek tam bir ekosistem oluşturulabilir.
- Model: GPT-3.5 Turbo
- Amaç: Video için verilen metin ve başlık üzerinden anahtar noktaları ve segmentleri çıkarır.
- Kullanım: Video içerik planlaması ve segmentasyon.
- Model: Image 1
- Amaç: Text-to-Image ile video sahneleri ve içerik görselleri oluşturur.
- Kullanım: Video sahnelerinin görselleştirilmesi.
- Model: GPT-4 Mini
- Amaç: Metinleri doğal seslendirme ile videoya dönüştürür.
- Kullanım: Videoların otomatik seslendirilmesi.
- Model: Whisper
- Amaç: Seslendirmeden speech-to-text ile altyazı üretir ve zaman damgası ekler.
- Kullanım: Videolara otomatik altyazı eklenmesi.
- Model: Qwen3
- Amaç: Videoların vektör embeddinglerini çıkarır.
- Database: Vektör database (örn. Pinecone, Weaviate)
- Kullanım: Videolar arası öneri ve benzer içerik sistemi.
- Araç: Movipy
- Amaç: Oluşturulan görseller, ses ve altyazıları birleştirerek lokal video dosyası üretir.
- Model: Gemini 2.5 Flash
- Amaç: Video içeriğine dayalı quiz ve teyit soruları üretir.
- Kullanım: Öğrenme ve etkileşim amaçlı içerik artırımı.
graph TD
A[Text / Title] --> B[GPT-3.5 Turbo: Video Key Points / Segments]
B --> C[Image 1: Video Görselleri]
B --> D[GPT-4 Mini: Video Seslendirme]
D --> E[Whisper: Altyazı + Zaman Damgası]
B --> F[Qwen3 + Vector DB: Öneri Sistemi]
C --> G[Movipy: Local Video Dosyası]
B --> H[Gemini 2.5 Flash: Quiz / Teyit Soruları]