Skip to content

akmalgoldi/car-price-prediction

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🚗 UK Used Car Valuation System (End-to-End Machine Learning)

Python Scikit-Learn Streamlit Status

Aplikasi berbasis AI untuk memprediksi harga pasar mobil bekas di Inggris (UK) berdasarkan spesifikasi kendaraan. Proyek ini dibangun dengan metodologi Data Science End-to-End, mulai dari pembersihan data (Data Cleaning), analisis visual (EDA), hingga deployment model menggunakan Streamlit.

📸 Demo Aplikasi

Berikut adalah tampilan antarmuka saat sistem berhasil memprediksi harga mobil dengan akurasi tinggi:

Tampilan Dashboard Hasil Prediksi

Dashboard menampilkan estimasi harga, rentang harga wajar, dan konversi ke Rupiah.

🎯 Fitur Utama

  • Akurasi Tinggi: Menggunakan algoritma Random Forest Regressor dengan R2 Score: 94.4%.
  • Estimasi Real-Time: Memberikan prediksi harga dalam mata uang GBP (£) dan estimasi Rupiah (IDR).
  • Rentang Harga Wajar: Menampilkan batas bawah dan atas harga wajar berdasarkan Mean Absolute Error (MAE).
  • Interactive Dashboard: Antarmuka web modern dengan input sidebar dan validasi data.

📊 Insight & Visualisasi Data

Sebelum pemodelan, dilakukan analisis mendalam (Exploratory Data Analysis) untuk memahami pola harga:

1. Korelasi Fitur (Correlation Heatmap) Terlihat bahwa engineSize (Ukuran Mesin) memiliki korelasi positif terkuat terhadap harga, sedangkan mileage (KM) memiliki korelasi negatif. Correlation Heatmap

2. Distribusi Harga per Merek Brand seperti Mercedes-Benz dan Audi memiliki median harga tertinggi, sedangkan Vauxhall menjadi opsi paling ekonomis. Boxplot Distribution

🛠️ Alur Kerja & Teknologi

Dataset berasal dari 100,000 UK Used Car Data set di Kaggle.

Langkah Pengerjaan:

  1. Data Ingestion: Menggabungkan file CSV terpisah dari berbagai merek (Audi, BMW, Ford, dll).
  2. Data Cleaning:
    • Standardisasi nama kolom (tax vs tax(£)).
    • Mapping nama brand (cclass -> Mercedes-Benz).
    • Handling missing values & duplikat.
  3. Model Engineering: Membangun Scikit-Learn Pipeline dengan OneHotEncoder dan StandardScaler.
  4. Deployment: Membuat web app interaktif dengan Streamlit.

🚀 Cara Menjalankan (Installation)

  1. Clone Repository ini:

    git clone [https://github.com/akmalgoldi/car-price-prediction.git](https://github.com/akmalgoldi/car-price-prediction.git)
    cd car-price-prediction
  2. Install Library yang Dibutuhkan:

    pip install -r requirements.txt
  3. Jalankan Aplikasi:

    streamlit run app.py

📂 Struktur Folder

├── data/               # Dataset mentah dan yang sudah dibersihkan
├── docs/               # Aset gambar untuk dokumentasi
├── models/             # Model .pkl yang sudah dilatih
├── notebooks/          # Jupyter Notebooks (Cleaning, EDA, Training)
├── app.py              # Main Application File
├── requirements.txt    # Dependencies
└── README.md           # Dokumentasi Proyek

About

End-to-end Machine Learning web app to predict UK used car prices using Random Forest

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published