DATA SAVER es una herramienta automatizada diseñada para facilitar la extracción estructurada de información desde plataformas web que no cuentan con APIs públicas, mediante una arquitectura sencilla pero poderosa basada en FastAPI, Selenium y un frontend en HTML/JS puro.
⚠️ Este proyecto se desarrolló con fines educativos y demostrativos. No debe utilizarse para acceder a sistemas sin autorización explícita.
Permite seleccionar una o varias secciones desde una interfaz web intuitiva y extraer datos relevantes mediante un sistema backend orquestado con Selenium. La información se guarda automáticamente en archivos .CSV, listos para usarse.
- HTML5
- JavaScript puro (Vanilla JS)
- CSS3 personalizado
- FastAPI — para servir endpoints asincrónicos y rápidos
- Selenium — para automatizar navegación, scraping y recolección de datos
uvicorn(para desarrollo local)webdriver-manager(para gestión automática del driver)pandas(generación de CSV)
-
Clona el repositorio:
bash git clone https://github.com/MLlAlonso/FormScraper cd FormScraper -
Crea y activa un entorno virtual:
bash python -m venv .venv source .venv/bin/activate # En Windows: .venv\Scripts\activate -
Instala dependencias:
bash pip install -r requirements.txt -
Ejecuta el backend:
bash uvicorn scraper:app --reload -
Abre el
index.htmlen tu navegador (doble clic o con Live Server).
Los datos extraídos se almacenan automáticamente como archivos .csv nombrados por sección.
- El sistema soporta extracción múltiple (batch scraping) y navegación dinámica por sección.
Este proyecto está bajo la licencia CC BY-NC-ND 4.0.
- Puedes ver el código, compartirlo y estudiarlo, pero no puedes modificarlo ni usarlo con fines comerciales.
- Consulta el archivo
LICENSE.mdpara más detalles.
- Esta herramienta no fue desarrollada para producción.
- El scraping automatizado puede contravenir los Términos de Servicio de algunas plataformas.
- El autor no se responsabiliza por el mal uso del código.
📌 Desarrollado por Mikkel Llaven Alonso
✉️ mikkel_03@outlook.com
💼 LinkedIn