Aplikasi berbasis AI untuk memprediksi harga pasar mobil bekas di Inggris (UK) berdasarkan spesifikasi kendaraan. Proyek ini dibangun dengan metodologi Data Science End-to-End, mulai dari pembersihan data (Data Cleaning), analisis visual (EDA), hingga deployment model menggunakan Streamlit.
Berikut adalah tampilan antarmuka saat sistem berhasil memprediksi harga mobil dengan akurasi tinggi:
Dashboard menampilkan estimasi harga, rentang harga wajar, dan konversi ke Rupiah.
- Akurasi Tinggi: Menggunakan algoritma Random Forest Regressor dengan R2 Score: 94.4%.
- Estimasi Real-Time: Memberikan prediksi harga dalam mata uang GBP (£) dan estimasi Rupiah (IDR).
- Rentang Harga Wajar: Menampilkan batas bawah dan atas harga wajar berdasarkan Mean Absolute Error (MAE).
- Interactive Dashboard: Antarmuka web modern dengan input sidebar dan validasi data.
Sebelum pemodelan, dilakukan analisis mendalam (Exploratory Data Analysis) untuk memahami pola harga:
1. Korelasi Fitur (Correlation Heatmap)
Terlihat bahwa engineSize (Ukuran Mesin) memiliki korelasi positif terkuat terhadap harga, sedangkan mileage (KM) memiliki korelasi negatif.

2. Distribusi Harga per Merek
Brand seperti Mercedes-Benz dan Audi memiliki median harga tertinggi, sedangkan Vauxhall menjadi opsi paling ekonomis.

Dataset berasal dari 100,000 UK Used Car Data set di Kaggle.
Langkah Pengerjaan:
- Data Ingestion: Menggabungkan file CSV terpisah dari berbagai merek (Audi, BMW, Ford, dll).
- Data Cleaning:
- Standardisasi nama kolom (
taxvstax(£)). - Mapping nama brand (
cclass->Mercedes-Benz). - Handling missing values & duplikat.
- Standardisasi nama kolom (
- Model Engineering: Membangun Scikit-Learn Pipeline dengan
OneHotEncoderdanStandardScaler. - Deployment: Membuat web app interaktif dengan Streamlit.
-
Clone Repository ini:
git clone [https://github.com/akmalgoldi/car-price-prediction.git](https://github.com/akmalgoldi/car-price-prediction.git) cd car-price-prediction -
Install Library yang Dibutuhkan:
pip install -r requirements.txt
-
Jalankan Aplikasi:
streamlit run app.py
├── data/ # Dataset mentah dan yang sudah dibersihkan
├── docs/ # Aset gambar untuk dokumentasi
├── models/ # Model .pkl yang sudah dilatih
├── notebooks/ # Jupyter Notebooks (Cleaning, EDA, Training)
├── app.py # Main Application File
├── requirements.txt # Dependencies
└── README.md # Dokumentasi Proyek
