Skip to content

MLlAlonso/FormScraper

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

DATA SAVER | Web Automation & Extraction Tool

Python HTML5 JavaScript

DATA SAVER es una herramienta automatizada diseñada para facilitar la extracción estructurada de información desde plataformas web que no cuentan con APIs públicas, mediante una arquitectura sencilla pero poderosa basada en FastAPI, Selenium y un frontend en HTML/JS puro.

⚠️ Este proyecto se desarrolló con fines educativos y demostrativos. No debe utilizarse para acceder a sistemas sin autorización explícita.


¿Qué hace?

Permite seleccionar una o varias secciones desde una interfaz web intuitiva y extraer datos relevantes mediante un sistema backend orquestado con Selenium. La información se guarda automáticamente en archivos .CSV, listos para usarse.


Tecnologías usadas

🔸 Frontend

  • HTML5
  • JavaScript puro (Vanilla JS)
  • CSS3 personalizado

🔹 Backend

  • FastAPI — para servir endpoints asincrónicos y rápidos
  • Selenium — para automatizar navegación, scraping y recolección de datos

Dependencias clave

  • uvicorn (para desarrollo local)
  • webdriver-manager (para gestión automática del driver)
  • pandas (generación de CSV)

¿Cómo ejecutarlo localmente?

  1. Clona el repositorio: bash git clone https://github.com/MLlAlonso/FormScraper cd FormScraper

  2. Crea y activa un entorno virtual: bash python -m venv .venv source .venv/bin/activate # En Windows: .venv\Scripts\activate

  3. Instala dependencias: bash pip install -r requirements.txt

  4. Ejecuta el backend: bash uvicorn scraper:app --reload

  5. Abre el index.html en tu navegador (doble clic o con Live Server).


Exportación de datos

Los datos extraídos se almacenan automáticamente como archivos .csv nombrados por sección.

  • El sistema soporta extracción múltiple (batch scraping) y navegación dinámica por sección.

Licencia

Este proyecto está bajo la licencia CC BY-NC-ND 4.0.

  • Puedes ver el código, compartirlo y estudiarlo, pero no puedes modificarlo ni usarlo con fines comerciales.
  • Consulta el archivo LICENSE.md para más detalles.

Notas legales

  • Esta herramienta no fue desarrollada para producción.
  • El scraping automatizado puede contravenir los Términos de Servicio de algunas plataformas.
  • El autor no se responsabiliza por el mal uso del código.

📌 Desarrollado por Mikkel Llaven Alonso
✉️ mikkel_03@outlook.com
💼 LinkedIn

About

Herramienta automatizada diseñada para facilitar la extracción estructurada de información

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published