Skip to content

Telecom X es un proyecto/challenge dentro de la formación “Aprendiendo a hacer ETL G8 - ONE”. Consiste en extraer, transformar y analizar un conjunto de datos de clientes de una compañía de telecomunicaciones, aplicando buenas prácticas de Data Engineering.

License

Notifications You must be signed in to change notification settings

dev-sandoval/TelecomX-01

Repository files navigation

🚀 Telecom X ETL Challenge

Python Pandas NumPy License: MIT

ETL Badge


🔍 Descripción

Telecom X es un proyecto/challenge dentro de la formación “Aprendiendo a hacer ETL G8 - ONE”. Consiste en extraer, transformar y analizar un conjunto de datos de clientes de una compañía de telecomunicaciones, aplicando buenas prácticas de Data Engineering.


🎯 Propósito

  1. Aprender el flujo completo de un proceso ETL (Extract‑Transform‑Load).
  2. Practicar técnicas de limpieza, normalización y enriquecimiento de datos.
  3. Visualizar insights clave de negocio a través de gráficas.
  4. Documentar y estructurar el código para producción y aprendizaje.

🛠 Tecnologías

  • Lenguaje: Python 🐍
  • Librerías:
  • Notebook: Jupyter Notebook ☕
  • Formato de datos: JSON, CSV

⚙️ Estructura del Proyecto

TelecomX_ETL_Challenge/
├── data/
│   ├── TelecomX_Data.json    # Datos originales
│   └── TelecomX_Cleaned.csv  # Datos transformados
├── notebooks/
│   └── TelecomX_ETL_Solution.ipynb  
├── LICENSE
└── README.md

🚀 Cómo Empezar

  1. Clonar el repositorio

    git https://github.com/sandovaldavid/TelecomX-ETL-Challenge.git
    cd TelecomX-ETL-Challenge
  2. Crear y activar un entorno virtual

    python3 -m venv venv
    source venv/bin/activate  # Linux/macOS
    venv\Scripts\activate     # Windows
  3. Instalar dependencias

    pip install -r requirements.txt
  4. Registrar environment como Kernel para Jupyter

        python -m ipykernel install --user --name ETL-env --display-name "Python (ETL-env)"

5.Abrir el Notebook

# Version clásica de Jupyter
jupyter notebook
 # O si prefieres la versión más moderna
jupyter lab

📊 Features & Gráficas

  • ETL Completo: extracción de JSON, transformación (flatten, limpieza, buckets), carga a CSV.

  • 📈 Análisis Descriptivo: describe(), detección de valores nulos y outliers.

  • 📉 Visualizaciones:

    • Distribución de Churn
    • Histograma de Tenure
    • Boxplot de Monthly Charges vs. Churn
    • Matriz de correlación de variables numéricas

📄 Licencia

Este proyecto está bajo la Licencia MIT. ¡Disfruta y aprende! 🎉

About

Telecom X es un proyecto/challenge dentro de la formación “Aprendiendo a hacer ETL G8 - ONE”. Consiste en extraer, transformar y analizar un conjunto de datos de clientes de una compañía de telecomunicaciones, aplicando buenas prácticas de Data Engineering.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published