DATA SAVER | Web Automation & Extraction Tool

DATA SAVER es una herramienta automatizada diseñada para facilitar la extracción estructurada de información desde plataformas web que no cuentan con APIs públicas, mediante una arquitectura sencilla pero poderosa basada en FastAPI, Selenium y un frontend en HTML/JS puro.

⚠️ Este proyecto se desarrolló con fines educativos y demostrativos. No debe utilizarse para acceder a sistemas sin autorización explícita.

¿Qué hace?

Permite seleccionar una o varias secciones desde una interfaz web intuitiva y extraer datos relevantes mediante un sistema backend orquestado con Selenium. La información se guarda automáticamente en archivos .CSV, listos para usarse.

Tecnologías usadas

🔸 Frontend

HTML5
JavaScript puro (Vanilla JS)
CSS3 personalizado

🔹 Backend

FastAPI — para servir endpoints asincrónicos y rápidos
Selenium — para automatizar navegación, scraping y recolección de datos

Dependencias clave

uvicorn (para desarrollo local)
webdriver-manager (para gestión automática del driver)
pandas (generación de CSV)

¿Cómo ejecutarlo localmente?

Clona el repositorio: bash git clone https://github.com/MLlAlonso/FormScraper cd FormScraper
Crea y activa un entorno virtual: bash python -m venv .venv source .venv/bin/activate # En Windows: .venv\Scripts\activate
Instala dependencias: bash pip install -r requirements.txt
Ejecuta el backend: bash uvicorn scraper:app --reload
Abre el index.html en tu navegador (doble clic o con Live Server).

Exportación de datos

Los datos extraídos se almacenan automáticamente como archivos .csv nombrados por sección.

El sistema soporta extracción múltiple (batch scraping) y navegación dinámica por sección.

Licencia

Este proyecto está bajo la licencia CC BY-NC-ND 4.0.

Puedes ver el código, compartirlo y estudiarlo, pero no puedes modificarlo ni usarlo con fines comerciales.
Consulta el archivo LICENSE.md para más detalles.

Notas legales

Esta herramienta no fue desarrollada para producción.
El scraping automatizado puede contravenir los Términos de Servicio de algunas plataformas.
El autor no se responsabiliza por el mal uso del código.

📌 Desarrollado por Mikkel Llaven Alonso
✉️ mikkel_03@outlook.com
💼 LinkedIn

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
img		img
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
course.js		course.js
cursos_map.json		cursos_map.json
index.html		index.html
scraper.py		scraper.py
styles.css		styles.css
theme.js		theme.js

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

DATA SAVER | Web Automation & Extraction Tool

¿Qué hace?

Tecnologías usadas

🔸 Frontend

🔹 Backend

Dependencias clave

¿Cómo ejecutarlo localmente?

Exportación de datos

Licencia

Notas legales

About

Uh oh!

Releases

Packages

Languages

License

MLlAlonso/FormScraper

Folders and files

Latest commit

History

Repository files navigation

DATA SAVER | Web Automation & Extraction Tool

¿Qué hace?

Tecnologías usadas

🔸 Frontend

🔹 Backend

Dependencias clave

¿Cómo ejecutarlo localmente?

Exportación de datos

Licencia

Notas legales

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages