dbt (data build tool) adalah sebuah tool untuk transformasi data di dalam warehouse yang memungkinkan tim data melakukan modeling, testing, dan dokumentasi data secara terstruktur. dbt bukan alat untuk ekstraksi atau loading data (ETL), melainkan fokus pada transformasi data setelah data berada di warehouse (dikenal juga sebagai T dalam ELT).
- Transformasi data: Mengubah data mentah menjadi data yang siap dipakai (clean, terstruktur, konsisten).
- Modular & versi kontrol: Semua transformasi ditulis dalam SQL atau Jinja (templating), sehingga bisa dikelola seperti kode software.
- Testing: Menyediakan fitur untuk memvalidasi data (misal memastikan tidak ada NULL di kolom penting).
- Dokumentasi & lineage: Bisa membuat dokumentasi otomatis dan menampilkan hubungan antar model data.
- Data sudah ada di data warehouse (misal BigQuery, Snowflake, Redshift, Postgres).
- dbt dijalankan untuk melakukan transformasi SQL dari tabel mentah menjadi tabel siap pakai (misal tabel fact & dimension).
- dbt juga bisa membuat views atau tables baru di warehouse.
- Mengikuti prinsip software engineering (version control, modularity, testing).
- Memudahkan kolaborasi tim data.
- Mendukung workflow staging → intermediate → mart, sehingga pipeline data lebih terstruktur.