Skip to content

Investigating the correlation between weather conditions and aviation accidents to address safety concerns during air travel. Utilizing meteorological data from the Brazilian National Institute of Meteorology for evidence-based insights.

License

Notifications You must be signed in to change notification settings

Syds674/Meteol_Project

Repository files navigation

PROJETO METEOL

Overview

O projeto Meteol visa extrair e processar dados meteorológicos, proporcionando análises fundamentais para diversas aplicações. Utilizando técnicas avançadas de engenharia de dados, busca-se fornecer insights valiosos e apoiar decisões informadas em setores como agricultura, energia e previsão climática. Este projeto também cria um ambiente configurado para a realização destes processos.

Clone o repositório em sua máquina local Linux e acesse a pasta Meteol_Project
git clone https://github.com/Syds674/Meteol_Project.git
cd Meteol_Project
Entre no diretório meteol e conceda permisões necessárias para o arquivo de criação de pastas
cd meteol
sed -i -e 's/\r$//' cria_dir.sh
Volte para a pasta Meteol_Project e execute o seguinte ocmando para a construção do ambiente:
sudo docker-compose -f all-docker-compose.yaml up
Em seguida, para realizar a cópia da estrutura de scripts para dentro do namenode, abra um novo terminal no diretório Meteol_Project e executar:
chmod +x copy_meteol_structure.sh
./copy_indicium_structure.sh

Obs.: Após a ultima execução irá conectar automáticamente no namenode.

Estando conectado no namenode, executar:
chmod 775 /meteol/cria_dir.sh
./meteol/cria_dir.sh

Obs.: Este comando irá criar a estrutura de pastas do HDFS

Executar o comando de criação de database no Hive:
spark-submit /meteol/create_database.py

Extração e exportação dos dados

Para a extração dos dados temos a pasta /meteol/scripts contendo os scripts que executarão todo processo de ETL

extracao_{data_de_extração_de_dados}.py
process_{nome_tabela}.py 
  • Script que une os asquivos csv em um data frame chamado table_{data_dos_dados_extraídos} e salva a tabela no hive.
Exemplo de execução do scripts
spark-submit spark-submit /meteol/scripts/extract_{data_dos_dados_extraídos}.py
spark-submit /indicium/scripts/process_{data_dos_dados_extraídos}.py 

Para consulta ao Hive e acesso as tabelas, utilize a seguinte URL

Applicação Url
Hue http://localhost:8888

User login: hue Password: hue

Dependências

Para a realização deste desafio foi utilizado o repositório:

https://github.com/mrugankray/Big-Data-Cluster

About

Investigating the correlation between weather conditions and aviation accidents to address safety concerns during air travel. Utilizing meteorological data from the Brazilian National Institute of Meteorology for evidence-based insights.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •