Skip to content

icarus-odak/backend

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Video Generation & Recommendation Backend

Bu proje, video tabanlı bir uygulama için backend pipeline sunmaktadır. Pipeline, metinden videoya, videodan altyazıya, embedding ve öneri sistemine kadar uçtan uca destek sağlar. Backend, farklı AI servisleri ve araçlarla entegre çalışacak şekilde tasarlanmıştır.

Bu proje, öncelikli olarak ODAK uygulamasının backend kısmını yönetmek için geliştirilmiştir. Diğer servisler (frontend, mobil uygulama vb.) eklenerek tam bir ekosistem oluşturulabilir.


Özellikler

1. Video Key Point Extraction

  • Model: GPT-3.5 Turbo
  • Amaç: Video için verilen metin ve başlık üzerinden anahtar noktaları ve segmentleri çıkarır.
  • Kullanım: Video içerik planlaması ve segmentasyon.

2. Video Görsel Üretimi

  • Model: Image 1
  • Amaç: Text-to-Image ile video sahneleri ve içerik görselleri oluşturur.
  • Kullanım: Video sahnelerinin görselleştirilmesi.

3. Video Seslendirme

  • Model: GPT-4 Mini
  • Amaç: Metinleri doğal seslendirme ile videoya dönüştürür.
  • Kullanım: Videoların otomatik seslendirilmesi.

4. Altyazı ve Zaman Damgası

  • Model: Whisper
  • Amaç: Seslendirmeden speech-to-text ile altyazı üretir ve zaman damgası ekler.
  • Kullanım: Videolara otomatik altyazı eklenmesi.

5. Video Embedding & Öneri Sistemi

  • Model: Qwen3
  • Amaç: Videoların vektör embeddinglerini çıkarır.
  • Database: Vektör database (örn. Pinecone, Weaviate)
  • Kullanım: Videolar arası öneri ve benzer içerik sistemi.

6. Local Video Üretimi

  • Araç: Movipy
  • Amaç: Oluşturulan görseller, ses ve altyazıları birleştirerek lokal video dosyası üretir.

7. Quiz ve Teyit Soruları

  • Model: Gemini 2.5 Flash
  • Amaç: Video içeriğine dayalı quiz ve teyit soruları üretir.
  • Kullanım: Öğrenme ve etkileşim amaçlı içerik artırımı.

Mimarisi

graph TD
    A[Text / Title] --> B[GPT-3.5 Turbo: Video Key Points / Segments]
    B --> C[Image 1: Video Görselleri]
    B --> D[GPT-4 Mini: Video Seslendirme]
    D --> E[Whisper: Altyazı + Zaman Damgası]
    B --> F[Qwen3 + Vector DB: Öneri Sistemi]
    C --> G[Movipy: Local Video Dosyası]
    B --> H[Gemini 2.5 Flash: Quiz / Teyit Soruları]
Loading