O projeto Meteol visa extrair e processar dados meteorológicos, proporcionando análises fundamentais para diversas aplicações. Utilizando técnicas avançadas de engenharia de dados, busca-se fornecer insights valiosos e apoiar decisões informadas em setores como agricultura, energia e previsão climática. Este projeto também cria um ambiente configurado para a realização destes processos.
git clone https://github.com/Syds674/Meteol_Project.gitcd Meteol_Projectcd meteolsed -i -e 's/\r$//' cria_dir.shsudo docker-compose -f all-docker-compose.yaml upEm seguida, para realizar a cópia da estrutura de scripts para dentro do namenode, abra um novo terminal no diretório Meteol_Project e executar:
chmod +x copy_meteol_structure.sh./copy_indicium_structure.shObs.: Após a ultima execução irá conectar automáticamente no namenode.
chmod 775 /meteol/cria_dir.sh./meteol/cria_dir.shObs.: Este comando irá criar a estrutura de pastas do HDFS
spark-submit /meteol/create_database.pyPara a extração dos dados temos a pasta /meteol/scripts contendo os scripts que executarão todo processo de ETL
extracao_{data_de_extração_de_dados}.py
- Script que extrai as tabelas do site https://portal.inmet.gov.br/uploads/dadoshistoricos/ disponibilizando os arquivos dentro do diretório do hdfs no formato /hdfs/data/order/{nome_tabela}/input/{nome_tabela}.csv
process_{nome_tabela}.py
- Script que une os asquivos csv em um data frame chamado table_{data_dos_dados_extraídos} e salva a tabela no hive.
spark-submit spark-submit /meteol/scripts/extract_{data_dos_dados_extraídos}.pyspark-submit /indicium/scripts/process_{data_dos_dados_extraídos}.py | Applicação | Url |
|---|---|
| Hue | http://localhost:8888 |
User login: hue Password: hue
- Docker:
- Install Docker on ubuntu: https://docs.docker.com/engine/install/ubuntu/
- Install Docker on windows: https://docs.docker.com/desktop/install/windows-install/